
大模型
文章平均质量分 91
JackieZhengChina
70'码农,优快云博客专家,信息系统项目管理师,工商管理硕士,CZB政采评审专家,中国采购与招标专家库专家,自驾爱好者,近20年教育类产品研发及管理经历,曾任教育科技公司联合创始人兼产品VP、科技公司产研VP。
职业标签:产品、项目、技术、运营、管理、战略。
展开
-
被骂惨的“现象级”Manus,今天我们来扒一扒它的真实水平!
但值得注意的是,哪怕作为“通用 Agent”,Manus 在大众中的使用门槛也是不低的。据李飞介绍,在使用层面可能出现两种情况:领域专家不用它,因为当前通用 Agent 还没有达到能够解决领域难题的程度;一般使用者不知道该怎么去用,就像我们在去用搜索的时候,提问是一件很难的一件事情。对此,李飞提出,当前很多 Agent 还是被动式的,需要用户以提问形式告诉它怎么做。原创 2025-03-08 13:29:49 · 1686 阅读 · 0 评论 -
用豆包帮你逐篇快速阅读DeepSeek的8篇论文
核心目标:探究语言模型缩放规律,构建并评估 DeepSeek LLM,推动开源语言模型向大规模发展,缩小与前沿模型差距。主要成果:确定新缩放法则与最优缩放策略,依此训练的 67B 模型在多基准测试中表现优异,部分超越 LLaMA - 2 70B 等,开源且为后续研究奠定基础。研究贡献:在缩放规律上取得突破,确定新模型表示和缩放策略;构建高质量数据集和有效训练模型;在多方面评估展示模型优势,为开源语言模型发展提供全面技术支持和实践经验。局限与未来。原创 2025-02-06 22:32:08 · 1219 阅读 · 0 评论 -
用DeepSeek分析总结一下DeepSeek发表过的8篇论文
DeepSeek正在构建一个覆盖语言、代码、视觉的多模态技术矩阵,同时通过开源策略和架构创新解决大模型落地中的成本与效率瓶颈。其强化学习驱动的技术路线可能成为下一代AI系统的差异化竞争优势。原创 2025-02-06 21:21:54 · 3273 阅读 · 0 评论 -
刘润:DeepSeek这把火,为何烧疼了硅谷?
但是,ChatGPT的用户协议里明确写着,不允许用我的模型,来训练新的模型,尤其是训练用来和我竞争的模型。关系到美国国家安全的“小院”(半导体和微电子,量子信息技术,和人工智能等等),对中国建设“高墙”(出口管制,限制签证,和审查投资等等)。这张照片,是只小狗。孩子会根据这种惩罚和奖励的反馈,不断自动调整姿势,直到终于在一个瞬间,就突然会走路了。而对中小企业和个人,可以像用水和用电一样,直接调用DeepSeek的API,使用DeepSeek的云端“智能资源”,然后按“度”(百万token)付费。原创 2025-01-30 16:02:04 · 1053 阅读 · 0 评论 -
没有专业 AI 团队,企业如何实现大模型驱动业务变革?
当下火热的大模型技术是人工智能领域的重大变革,其巨大的应用潜力正在对各行各业带来深远的影响和冲击。如今,很多企业已经将生成式人工智能的深度应用作为未来战略的关键组成部分,意图通过 AI 技术重塑研发、流程、业务,助力企业发掘全新的市场与机遇。然而,由于大模型技术诞生时间很短,其实践应用更处于早期探索阶段,因而要寻找对大模型有充分了解的技术和业务人才,搭建一支足以带领企业实现 AI 战略的团队对企业而言普遍是一大挑战。原创 2024-09-28 09:23:20 · 1098 阅读 · 0 评论