认知与目标
在开始学习AI相关内容前,先建立关于AI的认知与学习目标。
主要是为了缓解焦虑。也希望建立能坚定学习路线。
本认知构建的原则是“最小可行认知”。掌握目标所需的“最小必要知识”,先简单后深入。
- 认知
认知的核心公式:是什么 + 为什么 + 能做什么+ 我怎么做 + 趋势与挑战。
是什么:建立基础概念,明确技术定义与核心组件;
为什么:理解驱动力,技术诞生的背景与需求;
能做什么:应用场景、能力边界;
我怎么做:工具与方法论;
趋势与挑战:技术瓶颈、潜在机遇与职业发展路径。
- 目标
大模型应用开发工程师。
有不少人说过未来是创造的时代,也想,力不足。先能有一份工作,一步步来。
认知构建
AI
什么是AI?
AI是模仿人类行为的软件系统,通过算法(如机器学习、深度学习)和数据,实现感知(如计算机视觉)、推理(如自然语言处理)、决策(如强化学习)等能力。
技术支柱:机器学习(ML)、深度学习(DL)、生成式AI(GenAI)、Transformer模型(如GPT)、RAG(检索增强生成)等。
细分为弱人工智能(Weak AI)、强人工智能(Strong AI)、生成式AI。
-
生成式AI(AIGC)
通过模型生成内容(如文本、图像),是当前应用的核心技术(如Midjourney、ChatGPT)。
AIGC技术基础是LLM、GAN、扩散模型等。 -
大模型(Large Language Models, LLMs)
全称大语言模型,是基于大规模参数和数据训练的语言模型,通过深度学习技术(如Transformer架构)掌握语言规律,具备强大的文本生成、推理、多模态处理等能力(如GPT-4、Llama)。
我们经常听到的大模型LLM是AIGC的技术支撑,反过来理解,AIGC是LLM的应用延伸。
维度 | LLM | AIGC |
---|---|---|
核心能力 | 语言理解、生成、推理(如回答问题、逻辑分析)。 | 自动化内容创作(文本、图像、音频等)。 |
技术基础 | 深度学习、Transformer架构、大规模预训练。 | LLM、GAN(生成对抗网络)、扩散模型(如Stable Diffusion)。 |
应用场景 | 智能客服、机器翻译、代码生成(如GitHub Copilot)。 | 广告文案生成、图像设计、视频剪辑、学术写作辅助(知识库[10][12])。 |
目标 | 提升语言处理的智能化水平(接近AGI)。 | 提高内容生产的效率和多样性(替代或辅助人类创作)。 |
-
大模型应用开发
连接模型与业务场景。比如LangChain——构建大模型应用的开发框架,支持任务编排、工具集成与知识库调用。 -
RAG(Retrieval-Augmented Generation,检索增强生成)
生成式AI与检索技术的结合体。可以通过外部知识库(如文档、数据库、网页等)增强生成式AI(如大语言模型LLM)的能力,解决传统生成模型因训练数据固定导致的“知识过时”或“幻觉”问题。
很多企业定制大模型就是通过RAG。
为什么要学习AI?
国家将AI纳入国家战略(如“人工智能+”行动),推动传统产业升级。
AI+才是未来,Java是上一个时代“互联网+”的,现在末路了。
我个人的情况是二本学历+97年出生20年毕业5年Java经历。
对我而言,AI市场可选职业目标最容易入门的是AI大模型应用开发。有Java的工程经验,学历卡的也没那么死。
2025年高校毕业生人数为1222万,2024年高校毕业生人数为1179万,2023年高校毕业生人数1158万,2022年高校毕业生人数为1076万。以下是历年人数统计,供大家参考。
年份 | 高校毕业生人数 | 变化 |
---|---|---|
2025 | 1222万 | 增加43万 |
2024 | 1179万 | 增加21万 |
2023 | 1158万 | 增加82万 |
2022 | 1076万 | 增加167万 |
2021 | 909万 | 增加35万 |
2020 | 874万 | 增加40万 |
2019 | 834万 | 增加14万 |
2018 | 820万 | 增加25万 |
2017 | 795万 | 增加30万 |
2016 | 765万 | 增加16万 |
好不起来,焦虑——>化焦虑为动力。
能做什么?
AI发展趋势应该是——“没有AI不能做的事情,如果有,那就AI+”
学习AI可以从LangChain入手,逐步了解LLM,了解深度学习、Transformer架构等。做到大模型应用开发。
现在的AI+还在定义AI功能边界,平衡技术可行性与用户体验。少有标杆,市场待引爆。等引爆时为业务与大模型的浇水的大模型应用肯定是有一席之地的。
LangChain核心功能为链式流程、提示工程、Agent 开发、数据处理。目前适用于聊天机器人、文档分析、多步骤任务(如“先查数据再生成报告”)。
了解RAG,除大模型应用开发,还有条职业路线是“微调模型”。
怎么做?
从LangChain入手。LangChain的学习路线比较简单。LangChain在多个AI学习路线的位置都比较靠前,示例如下:
学习曲线网传是比较陡峭,但是相对较简单了。
领域 | 具体内容 |
---|---|
Python 编程 | 熟悉 Python 语法、面向对象编程、异常处理、模块化开发(如 pip 管理依赖)。 |
自然语言处理(NLP) | 了解词向量、文本分类、命名实体识别、生成式模型(如 GPT)的基本概念。 |
机器学习基础 | 对深度学习框架(如 PyTorch、TensorFlow)有初步了解,熟悉模型训练与推理流程。 |
环境配置 | 掌握 conda 或 virtualenv 环境管理,熟悉 torch 、torchvision 等库的版本兼容性 |
B站有课程,Z-lib也有《LangChain入门指南》等网友推荐比较多的一些书。
- 计划书单
《LangChain 入门指南构建高可复用、可扩展的 LLM 应用程序 》
《大模型应用开发 动手做AI Agent》
AI时代要做的还有很多,比如提升业务深度+技术深度+场景广度+提问能力+创意+决策等等。都一步步来吧
发展趋势如何?
总结
个人认为二本学历,目前工作一般没啥前景就去学大模型应用开发。简单学习路线是Python——>LangChain。
干,抓紧。