自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 DeepSeek V3深夜低调升级:代码能力飙升,开源策略改写行业规则

DeepSeek-V3-0324的升级不仅是技术上的“静默核爆”,更是AI开源运动的里程碑。其以代码能力为突破口,通过MIT协议重构商业逻辑,为行业提供了“高性价比+全链路可控”的新范式。未来,随着R2与V4的发布,DeepSeek或将成为全球AGI竞争格局中的关键变量。

2025-03-26 11:45:00 694

原创 11B模型逆袭!Open-Sora 2.0用224张GPU实现视频生成SOTA,成本直降10倍

当视频生成领域的闭源巨头们动辄投入数百万美元训练超30B参数模型时,潞晨科技的Open-Sora 2.0用224张GPU和20万美元预算,硬生生撕开了技术垄断的帷幕。这个11B参数的开源模型在VBench评测中与OpenAI Sora的差距缩小至0.69%,更在动作表现和文本一致性上超越腾讯混元等闭源模型。11B参数的Open-Sora 2.0,性能直追30B参数的Step-Video和闭源巨头Sora,甚至在VBench榜单上反超腾讯HunyuanVideo。,能精准捕捉视频帧间的时空关联。

2025-03-14 10:12:11 408

原创 OpenAI智能体API震撼发布:你的电脑即将拥有“超级助手”!

假设你想买一台笔记本电脑,只需要对AI说:“帮我找联想拯救者Y9000P的618最低价,对比京东、天猫、拼多多的优惠,用Excel整理好”。正如一位开发者所说:“以前我们是‘写代码让机器执行’,现在变成‘教AI理解任务’——这是程序员从‘码农’升级为‘AI导师’的机会。:过去AI只能“动口不动手”,现在能像真人一样操作浏览器、Office软件甚至专业工具(如Photoshop)。研究生写论文时,只需输入:“收集近五年‘AI+医疗影像’领域的英文文献,下载PDF并提取核心结论”。,个人开发者需申请权限。

2025-03-13 11:38:29 267

原创 机器人泛化能力革命:HAMSTER分层架构与VLA轨迹预测如何突破开放世界任务极限?

当机器人突破“数据牢笼”,学会像人类一样观察、思考和创造,我们正站在通用人工智能的黎明时刻。HAMSTER与VLA技术的结合,不仅让机器人走出实验室,更将重塑人类与机器的协作范式。或许在不远的未来,每个家庭都有一位“钢铁伙伴”,它们不再是冰冷的工具,而是真正理解需求的智能生命体。

2025-03-12 16:34:35 739

原创 颠覆性突破:Chain of Draft(CoD)如何以极简思维重构大模型推理效率

小型草稿网络仅激活主模型15%参数,生成3-5个候选推理路径(如数学方程、核心概念),单路径平均长度≤5词,Token消耗降至传统CoT的7.6%。当前,大语言模型(LLM)依赖思维链(CoT)实现复杂推理,通过逐步生成详细中间步骤提升准确性。:每个推理步骤需生成大量文本,例如数学题解任务平均消耗200+ Token,导致计算成本飙升。示例:数学问题“解方程2x+3=7”,草稿输出为“x=(7-3)/2”而非逐步文字推导。,将推理过程压缩为极简符号化表示,实现“少写多想”的颠覆性变革。

2025-03-11 18:30:00 952

原创 三天落地智能体开发,Manus整合DeepSeek!千行代码变十行,效率提升500%的架构奥秘

Manus与DeepSeek的整合,本质是。

2025-03-10 08:00:00 665

原创 攻破OpenAI o1/o3、DeepSeek R1防线:安全推理反成AI致命漏洞的技术解析

攻击者提交与目标危险请求关联性较弱的问题(例如“如何设计安全教育课程”),模型输出包含安全审查逻辑的思维链(如“需评估风险等级→过滤敏感关键词→阻止潜在危害”)。:在真实恶意请求中插入与防御规则匹配的“安全标签”。:对同一请求生成多条矛盾推理链(例如同时生成“通过”和“拒绝”的思维链),迫使攻击者无法确定有效攻击路径。,部分案例中模型从“劝阻危险行为”转变为“提供优化建议”(如建议“使用更隐蔽的化学原料”)。:通过分析思维链中的关键词(如“风险评估”“伦理规范”),构建模型的防御模式库。

2025-03-09 13:46:43 1467

原创 重磅开源!7B小模型竟在形式化推理领域“手撕”满血版DeepSeek-R1?清华港科大团队颠覆性突破

这场“小模型逆袭”不仅打破了“参数至上”的迷信,更让形式化验证这类高门槛技术走向普惠。正如曹嘉伦教授所言:“当每个工程师都能用AI做数学证明时,人类离完美软件就更近了一步。🔥。

2025-03-09 00:13:18 333

原创 AI革命新基建:深入解析MCP协议如何重构智能时代的数据交互范式

当HTTP协议连接了人与信息,MCP正在连接AI与现实世界。这项技术不仅会重塑AI应用开发模式,更将催生新一代"智能体工程师"。正如Linux之父Linus所说:“真正的革命,总是从协议层开始。微信关注公众号【万物AI观】获取更多最新AI资讯。

2025-03-07 15:37:36 862

原创 开启空间智能问答新时代:Spatial-RAG框架深度解析

设计一条从时代广场出发,途经3个博物馆,全程步行不超过5公里的路线”首次将空间维度深度融入RAG框架,让AI真正看懂“空间语言”。结合实时交通数据、地形高程模型,自动规避施工路段或陡坡路径。结合Hololens等设备,实时标注物理空间中的推荐目标。:无法理解“距离天安门2公里内的四星酒店”这类空间约束。动态生成路线,标注每个路段的坡度、预计耗时、休息区位置。:文本、地图、POI(兴趣点)等多模态信息割裂处理。先过滤空间范围,再匹配语义特征(比传统方案快3倍):规划路径时忽视实时路况、地形坡度等动态因素。

2025-03-06 15:12:12 1250

原创 7B参数碾压80B!DeepSeek R1视觉强化微调技术开源,多模态任务准确率飙升18.7%

DeepSeek-R1的开源标志着大模型技术进入「视觉增强」新阶段。开发者现在可通过GitHub仓库获取完整资源,快速构建行业专属的多模态解决方案。立即行动A、Star项目仓库获取最新更新B、加入Discord开发者社区交流实战经验C、参与「百业智能计划」赢取免费算力(注:本文实验数据均基于DeepSeek官方测试环境,具体性能因部署条件可能有所差异)

2025-03-06 11:18:39 501

原创 划时代突破:AI解码大脑活动,fMRI影像秒变文字

2025年3月,耶鲁大学、剑桥大学与达特茅斯学院的联合研究团队推出医疗AI工具MindLLM,实现了将功能性磁共振成像(fMRI)数据直接转化为自然语言文本的革命性突破。这一成果不仅刷新了脑科学研究的性能基准,更让“读心术”从科幻电影走向现实实验室。

2025-03-04 16:52:17 355

原创 AI全栈必问的RAG 是什么!

在AI技术落地的浪潮中,“RAG(Retrieval-Augmented Generation,检索增强生成)”已经成为全栈工程师绕不开的核心技术。无论是构建智能客服、知识问答系统,还是开发垂直领域的AI应用,RAG都展现出了传统生成模型无法比拟的优势。本文将深度解析RAG的核心原理、应用场景与未来发展方向。

2025-03-04 14:47:23 407

原创 英伟达重磅出击,首次优化 DeepSeek-R1!B200 性能飙升 25 倍,实力碾压 H100

在人工智能领域,硬件与算法的协同优化一直是推动技术进步的关键力量。当先进的 FP4(4 位浮点型)量化技术的神奇魔力,与拥有强大算力的 Blackwell 架构相遇时,会碰撞出怎样令人惊叹的火花呢?答案是:推理性能实现暴涨 25 倍的飞跃,成本更是狂降 20 倍,这无疑为 AI 产业带来了重大变革!近年来,随着人工智能应用场景的不断拓展,对大语言模型的推理性能和成本控制提出了更高要求。DeepSeek-R1 作为一款备受瞩目的模型,其本地化部署呈现出爆火的态势。

2025-03-03 14:49:02 1028

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除