[AI]浅谈大模型应用开发的认知构建

认知与目标

在开始学习AI相关内容前,先建立关于AI的认知与学习目标。
主要是为了缓解焦虑。也希望建立能坚定学习路线。

本认知构建的原则是“最小可行认知”。掌握目标所需的“最小必要知识”,先简单后深入。

  • 认知
    认知的核心公式:是什么 + 为什么 + 能做什么+ 我怎么做 + 趋势与挑战。

是什么:建立基础概念,明确技术定义与核心组件;
为什么:理解驱动力,技术诞生的背景与需求;
能做什么:应用场景、能力边界;
我怎么做:工具与方法论;
趋势与挑战:技术瓶颈、潜在机遇与职业发展路径。

  • 目标
    大模型应用开发工程师。

有不少人说过未来是创造的时代,也想,力不足。先能有一份工作,一步步来。

认知构建

AI

什么是AI?

AI是模仿人类行为的软件系统,通过算法(如机器学习、深度学习)和数据,实现感知(如计算机视觉)、推理(如自然语言处理)、决策(如强化学习)等能力。
技术支柱:机器学习(ML)、深度学习(DL)、生成式AI(GenAI)、Transformer模型(如GPT)、RAG(检索增强生成)等。

细分为弱人工智能(Weak AI)、强人工智能(Strong AI)、生成式AI。

  • 生成式AI(AIGC)
    通过模型生成内容(如文本、图像),是当前应用的核心技术(如Midjourney、ChatGPT)。
    AIGC技术基础是LLM、GAN、扩散模型等。

  • 大模型(Large Language Models, LLMs)
    全称大语言模型,是基于大规模参数和数据训练的语言模型,通过深度学习技术(如Transformer架构)掌握语言规律,具备强大的文本生成、推理、多模态处理等能力(如GPT-4、Llama)。

我们经常听到的大模型LLM是AIGC的技术支撑,反过来理解,AIGC是LLM的应用延伸。

维度LLMAIGC
核心能力语言理解、生成、推理(如回答问题、逻辑分析)。自动化内容创作(文本、图像、音频等)。
技术基础深度学习、Transformer架构、大规模预训练。LLM、GAN(生成对抗网络)、扩散模型(如Stable Diffusion)。
应用场景智能客服、机器翻译、代码生成(如GitHub Copilot)。广告文案生成、图像设计、视频剪辑、学术写作辅助(知识库[10][12])。
目标提升语言处理的智能化水平(接近AGI)。提高内容生产的效率和多样性(替代或辅助人类创作)。
  • 大模型应用开发
    连接模型与业务场景。比如LangChain——构建大模型应用的开发框架,支持任务编排、工具集成与知识库调用。

  • RAG(Retrieval-Augmented Generation,检索增强生成)
    生成式AI与检索技术的结合体。可以通过外部知识库(如文档、数据库、网页等)增强生成式AI(如大语言模型LLM)的能力,解决传统生成模型因训练数据固定导致的“知识过时”或“幻觉”问题。

很多企业定制大模型就是通过RAG。

为什么要学习AI?

国家将AI纳入国家战略(如“人工智能+”行动),推动传统产业升级。
AI+才是未来,Java是上一个时代“互联网+”的,现在末路了。

我个人的情况是二本学历+97年出生20年毕业5年Java经历。
对我而言,AI市场可选职业目标最容易入门的是AI大模型应用开发。有Java的工程经验,学历卡的也没那么死。
2025年高校毕业生人数为1222万,2024年高校毕业生人数为1179万,2023年高校毕业生人数1158万,2022年高校毕业生人数为1076万。以下是历年人数统计,供大家参考。

年份高校毕业生人数变化
20251222万增加43万
20241179万增加21万
20231158万增加82万
20221076万增加167万
2021909万增加35万
2020874万增加40万
2019834万增加14万
2018820万增加25万
2017795万增加30万
2016765万增加16万

好不起来,焦虑——>化焦虑为动力。

能做什么?

AI发展趋势应该是——“没有AI不能做的事情,如果有,那就AI+”

学习AI可以从LangChain入手,逐步了解LLM,了解深度学习、Transformer架构等。做到大模型应用开发。
现在的AI+还在定义AI功能边界,平衡技术可行性与用户体验。少有标杆,市场待引爆。等引爆时为业务与大模型的浇水的大模型应用肯定是有一席之地的。

LangChain核心功能为链式流程、提示工程、Agent 开发、数据处理。目前适用于聊天机器人、文档分析、多步骤任务(如“先查数据再生成报告”)。

了解RAG,除大模型应用开发,还有条职业路线是“微调模型”。

怎么做?

从LangChain入手。LangChain的学习路线比较简单。LangChain在多个AI学习路线的位置都比较靠前,示例如下:

![[Pasted image 20250417131327.png]]

学习曲线网传是比较陡峭,但是相对较简单了。

领域具体内容
Python 编程熟悉 Python 语法、面向对象编程、异常处理、模块化开发(如 pip 管理依赖)。
自然语言处理(NLP)了解词向量、文本分类、命名实体识别、生成式模型(如 GPT)的基本概念。
机器学习基础对深度学习框架(如 PyTorch、TensorFlow)有初步了解,熟悉模型训练与推理流程。
环境配置掌握 condavirtualenv 环境管理,熟悉 torchtorchvision 等库的版本兼容性

B站有课程,Z-lib也有《LangChain入门指南》等网友推荐比较多的一些书。

  • 计划书单
    《LangChain 入门指南构建高可复用、可扩展的 LLM 应用程序 》
    《大模型应用开发 动手做AI Agent》

AI时代要做的还有很多,比如提升业务深度+技术深度+场景广度+提问能力+创意+决策等等。都一步步来吧

发展趋势如何?

![[Pasted image 20250417140932.png]]

总结

个人认为二本学历,目前工作一般没啥前景就去学大模型应用开发。简单学习路线是Python——>LangChain。

干,抓紧。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值