初步理解大模型
背景
在25年新年假期前夕,随着DeepSeek力压ChatGPT登顶苹果美国地区应用商店免费APP下载排行榜的新闻登上热搜,注定了乙巳蛇年不在平凡,之后各类与之相关的新闻入潮水一般涌入了每个人的手机、电脑、大脑中,因此随之而来的春节假期也仍绕着一股智能味,春节联欢晚会上机器人来跳舞了,人工智能成为国家战略方向大力支持了,就是在年夜饭上哥哥姐姐们的事业发展、七大姑八大姨的婚嫁优育传统论题外,居然也都讨论起人工智能相关话题了,可见这次事件影响之深切与广泛,无形中倒是减轻了一些回老家聚会的压力(哈哈),作为软件行业从业者,如果在这种氛围中仍毫无思考和影响那是不可能的,春节假期期间,从业务角度对短期国内人工智能发展趋势进行了初步预测,预计会分为几个阶段,各个阶段均有一些特定的方向与获益企业:
- 基建阶段
各个行业开展与之相关的基础建设工作,寄希望于人工智能的快速建设拉动并产生一波相关业绩,典型行业医疗、政府机关等,这一时期的人工智能应用局限在相对初期的问答、知识库检索与相关推理生成方向上,这类应用难度较低,可快速产生效果,这个阶段有两类企业获益,第一是算力基础提供企业,比较典型的是一体机生产企业或厂商,第二是具有一定AI研发基础的技术服务企业,如各云厂商、几大运营商等,这个阶段持续时间不会很长,后续快速进入调整阶段。 - 调整阶段
这个阶段国家与相关部门会发布相关产业发展指导规范,避免大开大和的基础建设,逐步引导AI产业深化,用白话讲,就是避免盲目的高投入、低价值的项目建设,引导AI与产业结合形成落地项目的方向发展,这个阶段的应用类型逐步向智能体过度,期间具有行业经验、相关AI结合经验与基础的企业将会获益。 - 发展阶段
这个阶段在调整阶段后期出现,这个时期AI应用在各类行业已经形成模式,并且各行业对AI已经有明确的理解与定位,AI进入到了各个行业的深化发展时期,这是真正的变革的开始,这个阶段AI应用企业或产业会真正受益。并且对全社会产生深入影响(不亚于互联网浪潮)。
春节假期结束后,根据以上预测对市场反应进行了一些观察,目前看偏差不大,并利用一些时间开展了一些智能体应用开发的实验项目,在此期间对AI的理解与应用有所加深,在此白话一些理解和整理内容,以作记录并与大家探讨,预告一下,这个专栏以AI应用角度整理,如涉及深入的AI理论研究内容请自行学习其它文章(出门左转,不送),此篇是专栏的第一章理解大模型。
人工智能的分类
要理解大模型,首先需要了解一些人工智能的知识,大模型是人工智能领域的一个重要分支,人工智能可以根据能力、功能和应用领域进行分类:
(1)按能力分类
- 弱人工智能(Narrow AI)
- 专注于特定任务:语音识别(Siri)、图像分类(人脸识别)等。
- 强人工智能(General AI)
- 具备人类水平的通用智能:尚未实现(是大模型未来的发展方向)
- 超级人工智能(Super AI)
- 超越人类智能的理论概念:仅存在于科幻中
(2)按功能分类
- 感知智能
- 处理感官输入:计算机视觉、语音识别
- 认知智能
- 理解、推理和决策:自然语言处理、知识图谱
- 行动智能
- 控制物理动作:机器人、自动驾驶
(3)按技术方法分类
- 符号主义AI
- 基于规则和逻辑推理:专家系统
- 连接主义AI
- 依赖神经网络和深度学习:DeepSeek、ChatGPT
- 行为主义AI
- 通过交互学习:强化学习
大模型与专业模型的区别
维度 | 大模型 | 专业模型 |
---|---|---|
数据范围 | 跨领域、通用(多模态) | 聚焦垂直领域 |
参数量 | 百亿至万亿级 | 百万至十亿级 |
泛化能力 | 强(零样本/小样本学习) | 弱(专精特定任务) |
训练成本 | 极高 | 相对较低 |
应用场景 | 问答、创作等通用场景 | 科学计算等专业领域 |
核心差异:
- 大模型:追求"通用性"
- 专业模型:追求"精准性"
大模型的作用与定位
作用
- 信息处理:生成文本/代码/多模态内容
- 效率提升:自动化重复性工作
- 知识普惠:降低技术门槛
- 创新推动:辅助科研
定位
- 基础平台:提供通用API能力
- 增强工具:与专业模型结合
- 交互入口:自然语言接口
本章总结
根据以上内容可以很容易了解到,大模型正从"技术工具"演变为"智能基座",其发展将直接决定未来智能体的能力上限和应用边界。随着多模态融合、持续学习等技术的突破,基于大模型的智能体将逐步具备类人的认知和行动能力,而在此阶段受到大模型影响生活的人们应重点关注人与人工智能之间的定位,在这个人工智能浪潮中我们需要做哪些准备来融入智能社会,不局限于最终用户,也包括我们这些软件从业者,未来几期会围绕基于大模型的未来应用整理一些个人心得与大家分享,暂定后续章节包括大模型性能基本评价方法、大模型的感知与执行力、无限可能的智能体、大模型催生的新职业、大模型会制约创新吗等内容(随时调整),欢迎大家关注与探讨。