- 博客(523)
- 收藏
- 关注
原创 基于GitHub Actions与算力平台API:构建端到端的模型自动训练与部署流水线
通过GitHub Actions与算力平台API的集成,我们能够构建一个完全自动化的模型训练与部署流水线。这种方案不仅大幅提升了机器学习项目的迭代效率,还通过动态资源调度优化了计算成本。随着AI应用场景的不断扩展,基于CI/CD的自动化机器学习流水线将成为团队协作和模型交付的标准实践,而算力平台的API化则让这一过程的实现变得更加简单和高效。
2025-11-24 15:45:43
398
原创 千问一周破千万下载背后:AI应用需求的爆发与生态竞赛
千问APP公测一周下载量突破1000万次,成为史上增长最快的AI应用,这背后是AI技术从实验室走向日常生活的加速转变。
2025-11-24 15:35:31
83
原创 解决AI任务排队难题:基于Slurm的优先级调度与资源抢占策略配置详解
在高负荷的AI算力平台中,任务排队是影响研发效率的核心瓶颈。本文将深入介绍基于Slurm作业调度系统的优先级调度机制与资源抢占策略,通过实际配置案例展示如何优化计算资源分配,显著减少任务空闲等待时间。Slurm支援任务抢占功能,高优先权任务可抢占低优先权任务资源。被抢占任务可以取消、重设或挂起。如果启用回填调度(预设),系统会按bf_interval周期计算低优任务能否在不延迟高优任务前提下运行。
2025-11-21 14:33:37
922
原创 黄仁勋马斯克罕见同台!定调AI未来三大关键词:算力、货币失效与泡沫
而如今,生成式AI正在系统性地重塑这一格局——从智能对话、内容创作到新一代搜索引擎,这些基于生成式计算的任务对GPU算力提出了远超以往的需求。因为AI把图像分析做得更快、更准,医生就可以看更多图像、更多种类的影像,有更多时间和病人沟通,结果服务了更多患者。首先,数据洪流的计算范式转型。面对日益庞大的数据规模,传统CPU架构已难以满足高效处理需求,这促使整个行业向并行加速计算范式迁移,为人工智能的蓬勃发展奠定了坚实基础。在这个AI技术快速演进的时代,可以确定的是,算力作为数字经济新基建的地位将愈发稳固。
2025-11-21 14:16:19
1040
原创 Gemini 3.0重磅发布!架构革新:百万上下文、全模态推理与开发者生态重构
在系统架构设计中,它能够理解复杂的技术需求,提供合理的架构方案并生成相应的实现代码。这些进步体现在实际编码场景中,包括更好的代码质量、更准确的算法实现,以及更强的系统架构设计能力。在实际开发中,开发者现在可以直接将整个项目代码库输入模型,获得基于全局上下文的代码分析和优化建议,无需再采用分段处理的复杂方案。测试显示,该模型能够快速理解大型遗留系统的代码结构,识别潜在的技术风险,并提出具体的重构建议。全世界都在期待的Gemini 3,在质的飞跃中,实现了AI大模型又一次“史诗级”飞跃。
2025-11-19 14:08:30
433
原创 千问APP正式上线!基于Qwen 3技术,阿里的AI to C战略全面启航
今天,阿里全力进军AI to C市场,统一其to C品牌:千问App公测版正式上线各大应用商店。
2025-11-17 18:43:24
347
原创 AI破解肝移植困局!斯坦福发布最新AI研究,利用LightGBM模型优化肝移植资源利用效率
每年数千例肝移植因捐献者死亡时间预测不准而失败。今天,AI给出了精准解决方案。
2025-11-14 16:06:54
342
原创 PaddleOCR-VL-vLLM-OpenAI-API使用教程来了!手把手教你搞定文档解析!
PaddleOCR-VL 是一个基于视觉语言模型的多功能图像识别工具,支持 OCR 文字识别、表格识别、公式识别和图表识别等功能。本文档介绍如何通过 OpenAI 兼容的 API 接口使用该模型。功能验证状态: 所有四种任务类型已通过完整测试,功能稳定可用(测试时间:2025-11-07)
2025-11-13 17:52:13
931
原创 告别繁琐文档处理!PaddleOCR-VL-vLLM-OpenAI-API本地部署教程:精准解析文本/表格/公式
PaddleOCR-VL-vLLM-OpenAI-API 是一款先进、高效的文档解析模型,专为文档中的元素识别设计。其核心组件为 PaddleOCR-VL-0.9B,这是一种紧凑而强大的视觉语言模型(VLM),它由 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型组成,能够实现精准的元素识别。该模型支持 109 种语言,并在识别复杂元素(如文本、表格、公式和图表)方面表现出色,同时保持极低的资源消耗。
2025-11-07 17:02:00
1658
原创 视觉-文本压缩框架——Glyph本地部署教程,以视觉压缩重塑长上下文处理范式
Glyph是一个通过视觉文本压缩缩放上下文长度的框架。Glyph 没有扩展基于标记的上下文窗口,而是将长文本序列渲染为图像并使用视觉语言模型 (VLM) 对其进行处理。这种设计将长上下文建模的挑战转化为多模态问题,在保留语义信息的同时大幅降低了计算和内存成本。(上)长上下文任务的两种范式的比较:直接将纯文本输入 LLM 的传统方法,以及提出的基于 VLM 的范式 Glyph,它将文本渲染为紧凑的图像以实现大量的输入标记压缩。
2025-11-06 18:34:53
488
原创 Kimi发布新一代注意力架构!线性注意力实现75% KV缓存减少、6倍解码速度提升
月之暗面全新发布的混合线性注意力架构,有望解决大语言模型在处理长序列任务时面临的计算效率和性能瓶颈。
2025-10-31 17:01:23
640
原创 技术伦理之争:从维基百科到马斯克AI百科全书,知识生产模式的对立
马斯克AI百科上线即遭维基百科暗讽:88万文章vs700万,人类与机器谁代表未来?
2025-10-30 17:41:52
918
原创 推理成本吞噬AI未来,云计算如何平衡速度与成本的难题?
当前AI规模化应用正面临着核心困境:在追求极致响应速度的同时,如何控制呈指数级增长的计算成本?
2025-10-28 18:34:37
698
原创 PaddleOCR-VL本地部署教程:0.9B参数问鼎全球第一,轻量化模型实现多模态文档解析SOTA
是一个针对文档解析的 SOTA 和资源高效的模型。其核心组件是 PaddleOCR-VL-0.9B,这是一个紧凑而强大的视觉语言模型(VLM),它将 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型集成在一起,以实现精确的元素识别。该创新模型高效支持 109 种语言,并在识别复杂元素(如文本、表格、公式和图表)方面表现出色,同时保持最低的资源消耗。
2025-10-27 18:37:35
1536
原创 云计算大佬揭秘AI如何改变程序员未来,这些技能将成关键
AI时代,程序员的角色正在经历怎样的转变?云计算领域大佬Jeff Barr近日在上海分享了他的观点。
2025-10-24 18:34:37
860
原创 DeepSeek-OCR本地部署教程:DeepSeek突破性开创上下文光学压缩,10倍效率重构文本处理范式
DeepSeek-OCR 是深度求索(DeepSeek)于 2025 年 10 月 20 日开源的一款革命性 OCR 模型,其核心创新在于提出 上下文光学压缩 (Contexts Optical Compression)技术,通过视觉模态实现文本信息的高效压缩与解压。该模型以 3B 参数量实现了 SOTA 级性能,按照官方的说法,单张 A100-40G 显卡日处理能力超 20 万页数据,这为长文本处理和大模型优化提供了全新范式。
2025-10-23 18:18:20
2522
1
原创 OpenAI推出首款浏览器,能否撼动全球超30亿用户的Chrome?
今天凌晨,OpenAI正式加入了浏览器市场的竞争,推出了其首款AI浏览器ChatGPT Atlas。这款产品目前已率先在macOS平台上线,Windows、iOS和Android版本也将陆续推出。
2025-10-22 16:56:31
911
原创 DeepSeek新模型再次引爆外网!“上下文光学压缩”技术揭示了智能的本质
让AI学会“看图识字”,用更少的资源做更多的事。DeepSeek新模型做到了。
2025-10-21 18:27:04
392
原创 SAIL-VL2本地部署教程:2B/8B参数媲美大规模模型,为轻量级设备量身打造的多模态大脑
SAIL-VL2 是由抖音 SAIL 团队与新加坡国立大学 LV-NUS 实验室联合推出的一个多模态大模型,它在保持较小参数规模的同时,实现了媲美甚至超越部分大规模模型的性能。SAIL-VL2 框架概述。该架构由一个视觉编码器组成,将视觉输入对齐到 LLM 的表示空间。轻量级适配器进一步将视觉嵌入转换为标记化表示,这些表示与语言嵌入一起进行多模态推理和预测。SAIL-VL2 支持多种 LLM 主干,确保在不同模型配置下的灵活性和可扩展性。
2025-10-20 18:16:27
1081
原创 阿里最新开源!轻量级视觉模型Qwen3-VL-4B&8B-Instruct本地部署教程:小参数媲美顶尖模型
Qwen3-VL 是迄今为止 Qwen 系列中最强大的视觉语言模型。这一代产品全面升级:卓越的文本理解和生成、更深层次的视觉感知和推理、扩展的上下文长度、增强的空间和视频动态理解以及更强大的智能体交互能力。提供从边缘扩展到云的密集和 MoE 架构,并具有 Instruct 和推理增强型思维版本,可实现灵活的按需部署。更多信息请参考。
2025-10-17 17:00:18
1794
原创 李飞飞最新成果RTFM世界模型震撼问世,单块GPU就能跑
想象一下,仅用一张GPU,就能实时生成永不消失的3D世界——这不再是科幻小说,而是李飞飞团队带给我们的现实。
2025-10-17 16:50:35
804
原创 全球首个真实物理环境机器人基准测试发布,具身智能迎来统一评测标准
当机器人在演示视频中表现完美,却在真实环境中频频失误,该如何客观评估它们的真实能力?RoboChallenge的出现正在改变这一现状。
2025-10-16 17:24:33
895
原创 阿里开源最强视觉模型家族轻量版:仅4B/8B参数,性能逼近72B旗舰版
阿里通义千问团队最新开源的Qwen3-VL-4B与8B模型,正为端侧AI应用打开新的可能。
2025-10-15 17:00:29
831
原创 AI大神100美元手搓ChatGPT!nanochat教程爆火,4小时炼成聊天机器人
当科技巨头们竞相投入数亿美元开发大语言模型时,前特斯拉AI总监、OpenAI创始成员卡帕西却走上了一条截然不同的道路。
2025-10-14 18:05:12
525
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅