《动手学大模型》系列编程实践教程,源自上海交通大学2024年春季《人工智能安全技术》课程讲义的深度拓展,由资深教师张倬胜精心打造。
本教程专注于为大模型领域提供详尽的入门编程指导,以简洁明了的实践项目为载体,助力同学们迅速掌握大模型核心要义,为其后续的课程设计与学术研究筑牢根基,开启大模型探索之旅。
该教程内容较为专业,理解起来有一定难度,因此笔者对其进行了通俗易懂的解读,希望能够帮助读者更轻松地把握课程精髓。当然,若想深入透彻地理解,建议读者按照教程亲自进行实践操作。
此外,想要获取该课程的完整内容,可关注文末 2AGI 订阅号,发送消息“动手学大模型”,即可在后台获取。
01
—
第一章:微调与部署
通俗解读:想象你有一台多功能打印机,它已经能打印很多东西了,但你想让它在打印照片上效果更好。这就需要对打印机进行微调,然后把它设置成一个方便大家使用的模式。Demo 地址
1、熟悉使用 Transformers 工具包:这就像是你先要学会用打印机的说明书和配套的工具,这样才能知道怎么调整打印机的各种设置。
2、掌握预训练模型的微调、推理:微调就像是调整打印机的墨水浓度、打印分辨率等参数,让它更适合打印照片。推理就是让打印机根据这些调整好的参数去打印照片。这里面有两种方式,一种是你自己动手详细调整,就像自己调相机参数;另一种是用打印机自带的简单模式,直接打印。
3、掌握利用 Gradio Spaces 进行 Demo 部署:这就像是把调整好的打印机设置成一个展示模式,让别人可以直接来打印照片看看效果,就像在商场里设置的打印机体验区。
4、了解不同类型的预训练模型的选型和应用场景:不同的预训练模型就像不同类型的打印机,有的适合打印照片,有的适合打印文档。你要根据你想打印的内容,选择合适的打印机,这样才能达到最好的效果。
预训练语言模型的发展
大模型能力版图
开源家族:LLaMA与其后继者
02
—
第二章: 提示学习与思维链
通俗解读:有时候,我们向 AI 大模型提问,它的回答可能会出乎意料,甚至有点让人哭笑不得。但这可能只是因为它需要我们用更合适的方式去引导它,就像一个小朋友做错事,可能只是需要一点鼓励和正确的引导。Demo地址
1、熟悉大语言模型的使用方式:这就像是你刚拿到一个多功能的智能机器人,你要先了解怎么和它交流,用什么样的指令它能听得懂,然后才能让它按照你的想法去行动。
2、掌握零样本和少样本提示工程:零样本提示就像是你让机器人去完成一个它从来没做过的新任务,比如让它画一幅画,但你没给它看过任何画作,只能靠它自己发挥。少样本提示则是给机器人一点点参考,比如给它看几幅简单的画,然后再让它去画,这样它就能更好地完成任务。
3、了解思维链推理技术:这就像是教机器人一步一步地思考问题。比如你问它“为什么苹果会掉下来?”你可以引导它先想想苹果和地球之间的关系,再想想重力是怎么回事,最后得出苹果会掉下来是因为地球的引力这个结论。通过这种方式,机器人的回答就会更有逻辑、更准确。
大模型的“涌现能力”
思维链推理
高阶: Auto-CoT自动思维链
思维链推理的前沿发展
03
—
第三章:大模型知识编辑
通俗解读:想象你有一个会说话的智能盒子,它知道很多东西,但有些知识可能不太准确或者不是你想要的。现在你想让这个盒子记住一些特定的知识,这就需要对它进行知识编辑。Demo 地址
1、熟悉使用EasyEdit工具包:这就像是你有一套专门用来调整智能盒子的工具。有了这套工具,你就能很方便地对盒子里面的知识进行修改,就像用螺丝刀拧螺丝一样简单。
2、掌握语言模型的编辑方法(最简):编辑方法就像是给智能盒子调整知识的步骤。最简单的编辑方法,就好比你告诉盒子“把苹果的颜色改成红色”,它就能按照你的指令去修改,不需要太复杂的操作。
了解不同类型的编辑方法的选型和应用场景
3、不同类型的编辑方法的选型和应用场景:不同的编辑方法就像是不同的工具,有的适合修改简单的知识,比如上面说的苹果颜色;有的适合修改复杂一点的知识,比如解释为什么苹果会掉下来。你要根据你想修改的知识的类型,来选择合适的编辑方法,这样才能让智能盒子更好地记住你想要的知识。
能否高效地更新大型语言模型?
知识编辑的目的是高效地调整初始基础模型在特定编辑描述符上的行为。
大型语言模型(LLM)的解决方案:新兴能力
应用
04
—
第四章:模型水印
通俗解读:想象你有一台高级的打印机,它能在打印出来的纸上留下一种特殊的标记,这种标记人眼几乎看不见,但用专门的仪器就能检测出来,这就像是在语言模型生成的内容中嵌入的“水印”。Demo 地址
1、水印嵌入:这就像是在打印机打印文件的时候,悄悄在文件的某个角落或者文字的排列中,加入这种特殊的标记。比如在打印的文字间距、字体大小等细微之处做点小手脚,让生成的内容有了这个独特的“水印”。
2、水印检测:这就像是用一个专门的探测器,去检查打印出来的文件上有没有这种看不见的标记。就像安检时用探测仪检查有没有违禁品一样,通过特定的算法来检测给定文本的水印强度,看看水印是否存在以及明显不明显。
3、水印评估:这就像是对探测器的工作效果进行评价。看看它能不能准确地找出有水印的文件,会不会把没有水印的文件误认为是有水印的,评估水印方法的检测性能到底怎么样,是不是可靠。
4、评估水印的鲁棒性(可选):这就像是测试这个水印标记有多结实。比如文件被折叠了、弄脏了,或者被扫描后再打印,这个水印还能不能被检测出来。评估水印在各种情况下是不是都能保持稳定,不会轻易消失或者变形,让检测变得困难。
带有水印的文本在统计上会包含更多的绿色标记(tokens),这是不太可能出现在人类编写的文本中的属性。
文本质量和性能
水印强度与文本长度
05
—
第五章:大模型越狱攻击
通俗解读:想象你有一个很厉害的智能保险箱,里面装着很多重要的信息。这个保险箱就是大模型,它有很多安全设置,防止别人轻易获取里面的信息。但有时候,我们需要测试这个保险箱的安全性,这就需要用到“越狱攻击”。Demo 地址
1、熟悉使用EasyJailbreak工具包:这就像是你有一套专门用来测试保险箱安全性的工具。有了这套工具,你就能更容易地尝试打开保险箱,看看它的安全设置是不是真的有效。
2、掌握大模型的常用越狱方法的实现与结果:这就像是你要学会几种常见的方法来尝试打开保险箱。比如,你可以试着猜密码,或者用特殊的工具撬锁。通过这些方法,你可以看看能不能成功打开保险箱,也就是“越狱”,并且了解每种方法的效果如何,能不能真的获取到里面的信息。
*用户生成内容- 安全审核*
*AIGC 与 UGC*
**
**
自动优化越狱提示,直接利用现有大模型对抗生成更具威胁的越狱提示。
06
—
第六章:多模态大语言模型
通俗解读:想象你有一个超级智能的机器人,它不仅能听懂你说的话,还能看懂图片、视频,甚至能理解你在不同环境下的行为,就像它有多种感官一样。这个机器人就是多模态大语言模型。Demo 地址
1、熟悉多模态大语言模型的类型:这就像是了解不同类型的机器人。有的机器人擅长处理文字,有的机器人擅长看图识物,还有的机器人能同时处理多种信息。熟悉这些类型,就能知道哪种机器人更适合完成特定的任务。
2、掌握多模态大语言模型的通用技术框架:这就像是学会机器人工作的基本原理。就像你知道汽车是怎么通过发动机、轮子等部件协同工作的,掌握了这个通用技术框架,你就能理解多模态大语言模型是怎么把语言、图像等多种信息结合起来处理的。
3、掌握多模态大语言模型的搭建、训练和推理:这就像是学会自己组装机器人、教它学习新技能,并且让它根据学到的知识做出判断。搭建就是把机器人的各个部件组装起来;训练就是给它输入各种信息,让它学习如何处理这些信息;推理就是让它根据学到的知识,对新的情况做出合理的判断和反应。
多模态感知
音频感知多语言模型(MLLM)
文本+图片+视频
07
—
第七章:大模型智能体安全
通俗解读:想象你有一个很聪明的机器人管家,它不仅能帮你做家务,还能管理家里的各种设备,就像一个未来版的操作系统。但你可能会担心,这个机器人管家在面对各种复杂情况时,能不能意识到潜在的危险呢?Demo 地址
1、了解大模型智能体的架构与常见应用:这就像是先了解一下这个机器人管家的身体结构和它都能帮你做哪些事情。比如它有哪些功能模块,能打扫卫生、做饭,还是能控制家里的灯光、温度等设备。
2、了解大模型智能体驱动的“自主操作系统”:这就像是要知道这个机器人管家是怎么控制家里所有设备的。就像一个指挥中心,它怎么接收你的指令,然后让家里的各种设备协同工作,比如你一说“我要看电影”,它就自动调暗灯光、打开电视、准备好爆米花。
3、尝试大模型智能体安全测评与分析:这就像是给这个机器人管家做一次全面的体检,看看它在面对危险时能不能做出正确的反应。比如,如果家里有陌生人闯入,它能不能及时发现并报警;如果电器出现故障,它能不能及时切断电源,防止火灾等危险发生。
自主智能体
通讯代理:个性化、社交化、互动性
自主智能体架构:模块化架构
如何学习AI大模型?
大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?
”“谁的饭碗又将不保了?
”等问题热议不断。
不如成为「掌握AI工具的技术人」
,毕竟AI时代,谁先尝试,谁就能占得先机!
想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,或上手实操应用,增加自己的职场竞争力。
但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高
那么我作为一名热心肠的互联网老兵,我意识到有很多经验和知识值得分享给大家,希望可以帮助到更多学习大模型的人!至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
】
👉 福利来袭
优快云大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈
全套AGI大模型学习大纲+路线
AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!
640套AI大模型报告合集
这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉 福利来袭
优快云大礼包:《2025最全AI大模型学习资源包》免费分享,安全可点 👈
这份完整版的大模型 AI 学习资料已经上传优快云,朋友们如果需要可以微信扫描下方优快云官方认证二维码免费领取【保证100%免费
】
作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。