
深入浅出LLM
文章平均质量分 86
本系列以LLM大模型原理介绍与理论为基础,内容包括介绍经典大模型(chatgpt、chatglm、llama)等论文、模型结构、微调方式、数据集,后期会结合实战教学。
GoAI
优快云人工智能领域博客专家、新星计划计算机视觉方向导师、内容合伙人。阿里云社区专家博主、百度飞桨PPDE、飞桨校领航团团长、开源特训营导师,曾获多次AI比赛奖项及大厂实习,长期专注大数据与人工智能知识分享,相关合作和交流可私信。
展开
-
《深入浅出LLM基础篇》(一):大模型概念与发展
作者推出全新系列《深入浅出LLM》专栏,将分为基础篇、进阶篇、实战篇等,本文为基础篇具体章节如导图所示(导图为常见LLM问题,导图专栏后续更新!),将分别从各个大模型模型的概念、经典模型、创新点、微调、分布式训练、数据集、未来发展方向、RAG、Agent及项目实战等各种角度展开详细介绍,欢迎大家关注。原创 2024-03-04 17:39:28 · 4656 阅读 · 1 评论 -
《深入浅出LLM基础篇》(五):Propmt工程优化(上)
本篇为《深入浅出LLM基础篇》:Propmt工程优化,主要讨论各Propmt优化的tips,与效果差进行对比展示。由于 OpenAI模型的训练方式,特定的提示格式效果特别好,可以产生更有用的模型输出。OpenAI 的官方提示工程指南通常是提示技巧的最佳起点,大家有好的也可以在评论区交流学习。原创 2024-10-10 15:01:52 · 1203 阅读 · 0 评论 -
面经总结系列(八): 米哈游图像算法工程师暑期实习
GoAI的学习社区** 知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关(简历撰写技巧、面经资料与心得)多方面综合学习平台,强烈推荐AI小白及AI爱好者学习,性价比非常高!原创 2024-07-16 12:50:14 · 1109 阅读 · 0 评论 -
面经总结系列(七): 奇安信技术研究院算法工程师
本专栏主要为总结各小中大厂的面经系列总结,内容涵盖了多个热门技术领域,包括但不限于算法、机器学习、CV、NLP、大模型、测开、大数据、数分等,内容包括问题及详细答案,此外金邀请了行业内经验丰富的技术专家和面试官,分享面试经验和技巧,帮助求职者顺利通关各类技术面试。原创 2024-06-28 11:41:31 · 589 阅读 · 0 评论 -
面经总结系列(六): 阿里智能互联算法工程师机器学习
本专栏主要为总结各小中大厂的面经系列总结,内容涵盖了多个热门技术领域,包括但不限于算法、机器学习、CV、NLP、大模型、测开、大数据、数分等,内容包括问题及详细答案,此外金邀请了行业内经验丰富的技术专家和面试官,分享面试经验和技巧,帮助求职者顺利通关各类技术面试。原创 2024-06-01 19:42:44 · 1057 阅读 · 0 评论 -
面经总结系列(四): 元象科技大模型推理优化工程师
本专栏主要为总结各小中大厂的面经系列总结,内容涵盖了多个热门技术领域,包括但不限于算法、机器学习、CV、NLP、大模型、测开、大数据、数分等,内容包括问题及详细答案,此外金邀请了行业内经验丰富的技术专家和面试官,分享面试经验和技巧,帮助求职者顺利通关各类技术面试。原创 2024-05-21 21:38:17 · 1149 阅读 · 0 评论 -
面经总结系列(二): 面壁智能大模型算法工程师
本专栏主要为总结各小中大厂的面经系列总结,内容涵盖了多个热门技术领域,包括但不限于算法、机器学习、CV、NLP、大模型、测开、大数据、数分等,内容包括问题及详细答案,此外金邀请了行业内经验丰富的技术专家和面试官,分享面试经验和技巧,帮助求职者顺利通关各类技术面试。原创 2024-05-04 11:38:39 · 1118 阅读 · 1 评论 -
面经总结系列(一): 58同城算法工程师
本专栏主要为总结各小中大厂的面经系列总结,内容涵盖了多个热门技术领域,包括但不限于算法、机器学习、CV、NLP、大模型、测开、大数据、数分等,内容包括问题及详细答案,此外金邀请了行业内经验丰富的技术专家和面试官,分享面试经验和技巧,帮助求职者顺利通关各类技术面试。原创 2024-04-20 15:05:00 · 1439 阅读 · 1 评论 -
LLaMA-Factory实战推理
有效的微调已成为大型语言模型适应特定任务的必要条件之一。随着 Llama-Factory 的引入,这一全面的框架让训练更加高效,用户无需编写代码即可轻松为超过 100 个 LLMs 定制微调。原创 2024-06-02 20:06:39 · 2048 阅读 · 0 评论 -
《深入浅出LLM基础篇》(四):主流大模型介绍
本篇为《深入浅出LLM基础篇》系列第四篇,《深入浅出LLM基础篇》(四):主流大模型分类介绍主流大模型分类,主要讨论各类模型结构组成、模型特点、数据规模等进行介绍,包括 ChtaGLM、LLAMA等 系列,最后对经典问题进行总结,方便大家交流学习。原创 2024-05-13 14:00:00 · 2157 阅读 · 0 评论 -
《深入浅出LLM基础篇》(三):大模型结构分类
导读:本篇为《深入浅出LLM基础篇》系列第三篇,《深入浅出LLM基础篇》(三):大模型结构分类主要讨论大型语言模型是如何构建的,章节将着重讨论模型架构,主要讨论Transformer架构及编码、解码器组成结构及原理,这是真正实现大型语言模型的建模创新。原创 2024-05-10 17:44:44 · 2297 阅读 · 0 评论 -
《深入浅出LLM 》(二):大模型基础知识
作者推出全新系列《深入浅出LLM》专栏,将分为基础篇、进阶篇、实战篇等,本文为基础篇具体章节如导图所示(导图为常见LLM问题,导图专栏后续更新!),将分别从各个大模型模型的概念、经典模型、创新点、微调、分布式训练、数据集、未来发展方向、RAG、Agent及项目实战等各种角度展开详细介绍,欢迎大家关注。原创 2024-03-24 19:50:51 · 2736 阅读 · 0 评论 -
多模态大模型少样本自适应综述
为了通过微调提高模型的泛化性能,研究人员首先提出了基于提示的微调适应方法(例如,CoOp [14]),该方法将CLIP文本端的固定文本输入视为可学习的向量,然后使用少量样本进行微调,以适应下游任务。此外,引入基础语言模型或外部知识(如知识图谱,例如,CuPL [16])的方法可以帮助模型更好地处理未见样本,增强其语义理解和鲁棒性,从而提高其在少样本适应任务中的性能。因此,在这篇综述中,本文介绍并分析了多模态模型少样本适应方法的研究进展,总结了常用的数据集和实验设置,并比较了不同方法的结果**。原创 2024-05-13 10:45:00 · 504 阅读 · 0 评论 -
【 书生·浦语大模型实战营】作业(七):大模型实战评测
导读:本篇笔记内容主要为 【书生·浦语大模型实战营】作业(七):大模型实战评测的作业 主要对OpenCompass大模型实战评测部分及流程详细介绍,欢迎大家交流学习!原创 2024-05-03 14:06:45 · 611 阅读 · 0 评论 -
【 书生·浦语大模型实战营】学习笔记(七):大模型评测实战
本篇笔记内容主要为【 书生·浦语大模型实战营】学习笔记(七):大模型评测实战 ,主要对OpenCompass 大模型评测部分详细介绍,欢迎大家交流学习!原创 2024-05-03 12:28:15 · 1321 阅读 · 2 评论 -
【 书生·浦语大模型实战营】作业(六):Lagent & AgentLego 智能体应用搭建
本篇笔记内容主要为 【书生·浦语大模型实战营】作业(六):Lagent & AgentLego 智能体应用搭建智能体的作业 ,主要对智能体应用理论部分及具体搭建流程详细介绍,并分别进行实战应用及可视化展示,欢迎大家交流学习!原创 2024-05-03 11:07:56 · 1867 阅读 · 0 评论 -
【 书生·浦语大模型实战营】学习笔记(六):Lagent & AgentLego 智能体应用搭建
本篇笔记内容主要为 【书生·浦语大模型实战营】作业(六):Lagent & AgentLego 智能体应用搭建智能体的笔记 ,主要对智能体应用理论部分及具体搭建流程详细介绍,并分别进行实战应用及可视化展示,欢迎大家交流学习!原创 2024-05-03 11:08:45 · 1370 阅读 · 0 评论 -
【 书生·浦语大模型实战营】作业(四):XTuner 微调 LLM:1.8B、多模态、Agent
本篇为【 书生·浦语大模型实战营】作业(四):XTuner 微调 LLM:1.8B、多模态、Agent的基础作业:训练自己的小助手认知,记录复现过程并截图。原创 2024-04-28 21:05:20 · 523 阅读 · 0 评论 -
【 书生·浦语大模型实战营】学习笔记(四):XTuner 微调 LLM:1.8B、多模态、Agent
本篇笔记内容主要为XTuner 微调 LLM。主要对微调概念、XTuner框架等进行详细介绍,并对多模态LLava1.8b进行模型训练微调、模型合并、对话测试实战,欢迎大家交流学习!原创 2024-04-28 11:00:00 · 1830 阅读 · 2 评论 -
【 书生·浦语大模型实战营】作业(五):LMDeploy 量化部署
本篇笔记内容主要分为【 书生·浦语大模型实战营】学习笔记(五):LMDeploy 量化部署的作业。内容包括Task1:配置LMDeploy运行环境 Task2:以命令行方式与InternLM2-Chat-1.8B模型对话,欢迎大家交流学习!原创 2024-04-19 02:14:14 · 434 阅读 · 0 评论 -
【 书生·浦语大模型实战营】学习笔记(五):LMDeploy 量化部署
本篇笔记内容主要分为模型部署理论进行介绍。从量化、剪枝、知识蒸馏方面引入。主要对LMDeploy框架支持的模型、安装过程、base|chat对话|Lite量化等进行介绍,欢迎大家交流学习!原创 2024-04-19 02:05:04 · 1071 阅读 · 0 评论 -
【 书生·浦语大模型实战营】作业(三):“茴香豆” 搭建你的RAG 智能助理
本次作业内容: 在茴香豆 Web 版中创建自己领域的知识问答助手 - 参考视频零编程玩转大模型,学习茴香豆部署群聊助手。 - 线上茴香豆助手对话截图(不少于5轮) - 参考代码在自己的服务器部署茴香豆 Web 版(可选)在 InternLM Studio 上部署茴香豆技术助手 - 根据教程文档搭建 茴香豆技术助手,针对问题"茴香豆怎么部署到微信群?"进行提问原创 2024-04-12 17:42:27 · 421 阅读 · 0 评论 -
【 书生·浦语大模型实战营】学习笔记(三):“茴香豆” 搭建你的RAG 智能助理
本篇笔记内容主要分为RAG理论介绍和“茴香豆” RAG 智能助理实战。前半部分对RAG流程、向量数据库、优化等展开介绍,后半部分实战任务分为以web页面及Internlm框架进行茴香豆实战,欢迎大家交流学习!原创 2024-04-12 17:38:00 · 1333 阅读 · 0 评论 -
【 书生·浦语大模型实战营】作业(二):轻松玩转书生·浦语大模型趣味Demo
🎉知识星球是一个致力于提供《机器学习 | 深度学习 | CV | NLP | 大模型 | 多模态 | AIGC 》各个最新AI方向综述、论文等成体系的学习资料,配有全面而有深度的专栏内容,包括不限于 前沿论文解读、资料共享、行业最新动态以、实践教程、求职相关(简历撰写技巧、面经资料与心得)多方面综合学习平台,强烈推荐AI小白及AI爱好者学习,性价比非常高!➡️。原创 2024-04-05 23:51:58 · 566 阅读 · 0 评论 -
【 书生·浦语大模型实战营】学习笔记(二):轻松玩转书生·浦语大模型趣味Demo
本文为实战营第二次课程笔记,主要分为两个部分,第一部分部署 InternLM2-Chat-1.8B 模型进行智能对话。第二部分为完成 Lagent 工具调用 数据分析 Demo 部署,后续系列会继续更新,欢迎大家交流!原创 2024-04-05 23:37:56 · 1362 阅读 · 0 评论 -
【 书生·浦语大模型实战营】学习笔记(一):全链路开源体系介绍
本文为实战营第一次课程笔记,主要分为两个部分,第一部分从书生·浦语大模型发展、分类、组成进行详细介绍,方便大家理解。第二部分为对 InternLM2技术报告解读,后续系列会继续更新,欢迎大家交流!原创 2024-03-31 19:42:06 · 2044 阅读 · 2 评论 -
文心一言:中国版“ChatGPT”测评
本文主要介绍chatgpt概念及相关产品,重点介绍文心一言,通过对比Chatgpt、新必应及文心一言进行测评,对比仅挑选几个例子,主要展示文心一言在各方面的能力,大家感兴趣可以去官网申请等待,欢迎关注!原创 2023-03-21 11:46:25 · 7783 阅读 · 0 评论 -
《ChatGPT实操应用大全》探索无限可能
ChatGPT还能创造发明,他能够链接和融合全人类各个国家和各个学科的知识,轻轻松松做到跨学科融合创新,如果ChatGPT早出现50年,人类文明进程将会提速1000年。在本书《ChatGPT实操应用大全(全视频·彩色版)》中,我们精心挑选了150种案例,涵盖了论文撰写、PPT制作、数据分析、各语种翻译、短视频制作、AI绘画、公文写作等150类场景应用。ChatGPT让人类进入真正的AI时代,在这个时代,分类两类人,一类人积极学习并驾驭AI改造世界,火箭般提升工作学习效率,轻松击败内卷,“优胜”对手;原创 2023-12-01 21:06:06 · 844 阅读 · 0 评论