[AI]浅谈大模型应用开发的认知构建

最新推荐文章于 2025-04-26 11:07:26 发布

啾啾大学习

最新推荐文章于 2025-04-26 11:07:26 发布

阅读量694

点赞数 21

分类专栏： # AI杂谈文章标签：人工智能

本文链接：https://blog.youkuaiyun.com/mdwsmg/article/details/147315656

版权

AI杂谈专栏收录该内容

5 篇文章

订阅专栏

认知与目标

在开始学习AI相关内容前，先建立关于AI的认知与学习目标。
主要是为了缓解焦虑。也希望建立能坚定学习路线。

本认知构建的原则是“最小可行认知”。掌握目标所需的“最小必要知识”，先简单后深入。

认知
认知的核心公式：是什么 + 为什么 + 能做什么+ 我怎么做 + 趋势与挑战。

是什么：建立基础概念，明确技术定义与核心组件；
为什么：理解驱动力，技术诞生的背景与需求；
能做什么：应用场景、能力边界；
我怎么做：工具与方法论；
趋势与挑战：技术瓶颈、潜在机遇与职业发展路径。

目标
大模型应用开发工程师。

有不少人说过未来是创造的时代，也想，力不足。先能有一份工作，一步步来。

认知构建

AI

什么是AI?

AI是模仿人类行为的软件系统，通过算法（如机器学习、深度学习）和数据，实现感知（如计算机视觉）、推理（如自然语言处理）、决策（如强化学习）等能力。
技术支柱：机器学习（ML）、深度学习（DL）、生成式AI（GenAI）、Transformer模型（如GPT）、RAG（检索增强生成）等。

细分为弱人工智能（Weak AI）、强人工智能（Strong AI）、生成式AI。

生成式AI（AIGC）
通过模型生成内容（如文本、图像），是当前应用的核心技术（如Midjourney、ChatGPT）。
AIGC技术基础是LLM、GAN、扩散模型等。
大模型（Large Language Models, LLMs）
全称大语言模型，是基于大规模参数和数据训练的语言模型，通过深度学习技术（如Transformer架构）掌握语言规律，具备强大的文本生成、推理、多模态处理等能力（如GPT-4、Llama）。

我们经常听到的大模型LLM是AIGC的技术支撑，反过来理解，AIGC是LLM的应用延伸。

维度	LLM	AIGC
核心能力	语言理解、生成、推理（如回答问题、逻辑分析）。	自动化内容创作（文本、图像、音频等）。
技术基础	深度学习、Transformer架构、大规模预训练。	LLM、GAN（生成对抗网络）、扩散模型（如Stable Diffusion）。
应用场景	智能客服、机器翻译、代码生成（如GitHub Copilot）。	广告文案生成、图像设计、视频剪辑、学术写作辅助（知识库[10][12]）。
目标	提升语言处理的智能化水平（接近AGI）。	提高内容生产的效率和多样性（替代或辅助人类创作）。

大模型应用开发
连接模型与业务场景。比如LangChain——构建大模型应用的开发框架，支持任务编排、工具集成与知识库调用。
RAG（Retrieval-Augmented Generation，检索增强生成）
生成式AI与检索技术的结合体。可以通过外部知识库（如文档、数据库、网页等）增强生成式AI（如大语言模型LLM）的能力，解决传统生成模型因训练数据固定导致的“知识过时”或“幻觉”问题。

很多企业定制大模型就是通过RAG。

为什么要学习AI?

国家将AI纳入国家战略（如“人工智能+”行动），推动传统产业升级。
AI+才是未来，Java是上一个时代“互联网+”的，现在末路了。

我个人的情况是二本学历+97年出生20年毕业5年Java经历。
对我而言，AI市场可选职业目标最容易入门的是AI大模型应用开发。有Java的工程经验，学历卡的也没那么死。
2025年高校毕业生人数为1222万，2024年高校毕业生人数为1179万，2023年高校毕业生人数1158万，2022年高校毕业生人数为1076万。以下是历年人数统计，供大家参考。

年份	高校毕业生人数	变化
2025	1222万	增加43万
2024	1179万	增加21万
2023	1158万	增加82万
2022	1076万	增加167万
2021	909万	增加35万
2020	874万	增加40万
2019	834万	增加14万
2018	820万	增加25万
2017	795万	增加30万
2016	765万	增加16万

好不起来，焦虑——>化焦虑为动力。

能做什么？

AI发展趋势应该是——“没有AI不能做的事情，如果有，那就AI+”

学习AI可以从LangChain入手，逐步了解LLM，了解深度学习、Transformer架构等。做到大模型应用开发。
现在的AI+还在定义AI功能边界，平衡技术可行性与用户体验。少有标杆，市场待引爆。等引爆时为业务与大模型的浇水的大模型应用肯定是有一席之地的。

LangChain核心功能为链式流程、提示工程、Agent 开发、数据处理。目前适用于聊天机器人、文档分析、多步骤任务（如“先查数据再生成报告”）。

了解RAG，除大模型应用开发，还有条职业路线是“微调模型”。

怎么做？

从LangChain入手。LangChain的学习路线比较简单。LangChain在多个AI学习路线的位置都比较靠前，示例如下：

![[Pasted image 20250417131327.png]]

学习曲线网传是比较陡峭，但是相对较简单了。

领域	具体内容
Python 编程	熟悉 Python 语法、面向对象编程、异常处理、模块化开发（如 `pip` 管理依赖）。
自然语言处理（NLP）	了解词向量、文本分类、命名实体识别、生成式模型（如 GPT）的基本概念。
机器学习基础	对深度学习框架（如 PyTorch、TensorFlow）有初步了解，熟悉模型训练与推理流程。
环境配置	掌握 `conda` 或 `virtualenv` 环境管理，熟悉 `torch`、`torchvision` 等库的版本兼容性