功城师-优快云博客

原创世界级AI大佬吴恩达著作：LLM CookBook 汉化版本教程

🚀本教程面向入门 LLM 的开发者，深入浅出地介绍了对于开发者，如何构造Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能，是入门 LLM 开发的经典教程；

2025-04-01 23:23:33 685

原创图解大模型训练之：数据并行（DP、DDP、ZeRO、零冗余优化)

1、在DP中，每个GPU上都拷贝一份完整的模型，每个GPU上处理batch的一部分数据，所有GPU算出来的梯度进行累加后，再传回各GPU用于更新参数2、DP多采用参数服务器这一编程框架，一般由若个计算Worker和1个梯度聚合Server组成。Server与每个Worker通讯，Worker间并不通讯。因此Server承担了系统所有的通讯压力。基于此DP常用于单机多卡场景。3、异步梯度更新是提升计算通讯比的一种方法，延迟更新的步数大小决定了模型的收敛速度。

2025-04-01 23:19:24 591

原创程序员末日？AI大模型已替代45%岗位！2025年自救指南速看

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-04-01 23:16:34 982

原创做完RAG图片搜索后，才明白过去对RAG的理解完全不够

简单来说，图片RAG是一种将图像检索与生成模型结合的技术。它的核心思想是：先从海量数据中检索出与用户输入最相关的图像或信息，再将这些检索结果作为上下文，输入到生成模型中，输出高质量的响应。

2025-03-27 23:14:27 932

原创【2024医疗人工智能报告】|《2024年医疗人工智能研究报告-生成式AI爆发，医疗人工智能走到新的十字路口》||（附下PDF）_2024医疗健康ai大模型行业研究报告

导读《2024年医疗人工智能研究报告》由蛋壳研究院发布，深入探讨了医疗人工智能在2024年的发展现状与未来趋势。报告指出，随着大语言模型和生成式AI技术的快速发展，医疗领域的多个场景如互联网医疗、医学影像、新药研发等正经历重塑，释放出前所未有的价值。然而，同时强调，在融资形势严峻的背景下，医疗AI企业必须全面考量场景、技术、风控、商业化等多方面因素，以实现决策的精准性。研究核心聚焦于“场景”与“产品”，通过分析医院、药企、械企的供需逻辑和实战案例，为AI企业在布局、选品、研发、商业化方面提供参考建议。

2025-03-27 23:06:35 429

原创厦大团队：DeepSeek大模型及其企业应用实践（150页PPT，企业人员的大模型宝典）

12025年春节期间，DeepSeek的发布震撼全球，标志着人工智能大模型进入“普惠”时代，大模型开始深刻影响我们工作和生活的方方面面。每个人都有必要学习、了解和使用大模型。你是否渴望揭开大模型的神秘面纱？厦大团队带着满满诚意，重磅推出 4 个大模型科普报告！面向社会大众，我们用 140 页 PPT 深入浅出地讲解大模型概念、技术与应用实践，让每个人都能轻松读懂大模型。对高校而言，120页PPT深度剖析 DeepSeek 大模型如何赋能教学与科研，为学术创新注入新动力。

2025-03-25 22:12:42 277

原创抖音电商如何用 Agent 重做智能客服？一键获取同款！

在传统电商客服体系中，服务流程通常由智能客服系统与人工客服团队协同完成，并衍生出一系列前后端的配套服务。尽管大模型已经诞生近两年半，目前 AI 客服大都还停留在 SOP 辅助模式或 Copilot 协作模式。“不配置就回复不了”、“机械式单轮问答”、“幻觉问题误导客户”、“无法识别判读意图，答非所问”等问题仍然普遍存在。为了让 AI 客服更智能化，，在 AI 客服场景构建了人机协作的新型服务范式。当前主流智能客服系统通常采用的服务流程为：用户自主查询→机器人应答→转接人工。

2025-03-25 22:03:24 1015

原创 2025年最火技术岗来袭：大模型应用开发工程师，你准备好了吗？

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-03-23 00:02:25 901

原创一文彻底搞懂大模型-RAG

一、检索增强生成（RAG）什么是RAG？RAG（Retrieval-Augmented Generation，检索增强生成），RAG是一种 AI 框架，它将传统信息检索系统（例如数据库）的优势与生成式大语言模型 (LLM) 的功能结合在一起。LLM通过将这些额外的知识与自己的语言技能相结合，可以撰写更准确、更具时效性且更贴合具体需求的文字。什么是RAG？如何理解RAG？通过上一个问题，我们知道了什么是RAG？了解到RAG是一种结合了信息检索、文本增强和文本生成的自然语言处理（NLP）的技术。RAG的目的

2025-03-21 10:52:40 1074

原创大模型电子书学习推荐 |6本大模型书籍（附pdf版），看完少走一半弯路

自学大模型这6本书你一定要看，学完你就是大模型大师了

2025-03-21 10:45:39 895

原创小白也能微调大模型：LLaMA-Factory使用心得_llama factory

大模型火了之后，相信不少人都在尝试将预训练大模型应用到自己的场景上，希望得到一个垂类专家，而不是通用大模型。目前的思路，一是RAG(retrieval augmented generation)，在模型的输入prompt中加入尽可能多的“目标领域”的相关知识，引导模型在生成时尽量靠拢目标领域，运用prompt中给予的目标知识；二是有监督微调，用适量的专业领域的数据（或混通用语料）让模型更能生成目标场景的内容。本文主要讲的就是微调。

2025-03-17 23:52:12 797

原创 2025大模型时代已至，产品经理如何紧跟时代步伐？

在数字化浪潮的推动下，人工智能领域正迎来一场技术革命，而大模型技术的崛起无疑是这场革命中的明星。作为产品经理，我们不仅要洞察市场趋势，更要紧跟技术发展，以创新的思维和敏锐的洞察力，引领产品走向未来。本文将探讨大模型技术的市场现状，以及产品经理如何入行大模型，共同开创智能新时代。大模型技术的崛起为产品经理提供了巨大的机遇和挑战。作为产品经理，我们要紧跟时代步伐，深入了解大模型技术，洞察市场需求，打造创新产品，并组建专业团队支持产品的研发和迭代。只有这样，我们才能在这个充满机遇和挑战的时代中立足并取得成功。

2025-03-17 23:50:36 783

原创在自然语言处理(NLP)任务中，怎么处理数据——即怎么把文字输入到模型中进行处理？

文本序列化是自然语言处理任务的前置条件，而文本序列化需要经过分词，构建词汇表和序列化的几个步骤**”**在神经网络或者说在机器学习领域中，数据主要以向量的形式存在，表现形式为多维矩阵；但怎么把现实世界中的数据输入到神经网络中是机器学习的一个前提。但我们也知道，计算机只认识数字，而不认识文字和图片；因此，就需要把这些数据转换为计算机能够识别的格式；而在神经网络模型中就是怎么把这些数据转换为向量的格式。简单来说，就是把现实世界中的数据转化为用多维矩阵进行表示的过程。

2025-03-14 22:34:57 900

原创 2025大模型算法方,实习会经常提问哪些问题？ ?_大模型算法面试要刷算法题吗

现互联网研发一枚，曾拿过多个算法/研发岗SP offer，简要介绍一下大模型算法岗面试内容和如何准备面试。大模型算法岗的面试内容，实际上可以拆解成两部分，一是算法岗通用的面试内容，二是大模型专有相关部分。算法岗通用面试内容这部分内容很重要，因为通用的面试内容可以适用于不同的研发岗，包括算法、后端开发、数据开发等等，可以“一稿多用”；此外这部分基础掌握的好，也能给面试官留下基础扎实、高潜力的印象。通用的面试内容，通常分为个人经历介绍、手撕代码、原理考察、创新性问题几部分。

2025-03-14 22:30:07 1111

原创大模型部署全攻略！手把手教你部署开源 DeepSeek，告别访问受限困扰！

大模型正在重塑我们的学习和工作方式，不管你是选择使用 DeepSeek 还是自己部署大模型，最重要的是。近年来，大模型技术突飞猛进，全球各大科技公司纷纷投入研发，形成了一系列成熟的主流大模型。以下是目前国内外最具代表性的大模型：

2025-03-11 21:10:51 1001

原创风口出现！我国AI人才缺口达500万人

它打破了以往 AI 在功能和应用场景上的局限，具有跨领域协同的能力，能够在多个领域发挥作用，从办公场景中的文档处理、数据分析，到教育领域的教学辅助、个性化学习方案制定，再到金融领域的股票分析、投资策略制定等，都不在话下，堪称人们工作与生活中的得力 “数字助手”。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。，因为网上的资料太多太杂乱了，如果不能系统的学习就相当于是白学。

2025-03-11 21:02:35 1100

原创揭露大模型本质，2025大模型入门必看的12本书！看完我直接跪了_大模型学习书籍推荐

随着AI在越来越多的行业被应用，AI赋能的价值逐步体现出来。本书从AI的本质出发，介绍AI技术过往的发展历程和最新的理论成果，然后讲解如何站在移动互联网和大数据的基础上，系统地学习、应用AI技术。本书希望向读者提供学习AI技术的资料、路径，以及打磨AI产品的观点、思路。此外，本书通过介绍笔者接触、打磨AI产品的实际经历，给大家指出AI赋能过程中需要避免的“坑”，期待我们在AI时代共同发展自己、发展生活，在未来遇到更好的AI产品、更好的自己。

2025-03-10 14:09:11 694

原创 LaRA: RAG与长上下文LLM到底哪个更好

通过对七种开源和四种专有LLMs的系统性评估，我们发现RAG与LC之间的最优选择取决于模型参数规模、长文本处理能力、上下文长度、任务类型及检索片段特征等多重因素的复杂交互。我们的研究发现为实践者提供了切实可行的指导，助其在开发和部署LLM应用时有效利用RAG与LC方法。

2025-03-10 13:52:51 938

原创 DeepSeek带火AI大模型岗！急招岗年薪百万，人才缺口将达400万（附大模型教程）

正值年后跳槽高峰期，近期大火的国产AI大模型——DeepSeek发布的一系列高薪招聘信息在各大平台刷屏，阅读量上亿。微博热搜看来，今年春节期间DeepSeek的横空出世，不仅点燃了资本市场，更是引爆了AI人才市场。阿里的钉钉软件、华为的AI平台接连官宣全面接入DeepSeek系列模型，更有业内人士预测，未来五年，AI人才缺口将高达400万！互联网红利逐渐消退，AI领域立刻接棒，开启新一轮“造富神话”。根据脉脉发布的《2024年度人才迁徙报告》显示，《2024年度人才迁徙报告》部分内容。

2025-03-05 23:49:05 815

原创利用langchain-ChatGLM、langchain-TigerBot实现基于本地知识库的问答应用_langchain 本地知识库

刷B站的时候，无意中看到吴恩达的一个langchain的教程，然后去github上搜了下，发现别人利用langchain和chatGLM做的基于本地知识库的问答应用挺好的，学习下,同时增加了利用langchain-TigerBot实现的本地知识库。

2025-03-05 23:40:47 653

原创浙江大学｜153页《DeepSeek行业应用案例集》也来啦，DeepSeek居然已渗透到千行百业如此之深！（附下载方法）

《DeepSeek行业应用案例集：解锁智能变革密码》由浙江大学信息技术中心发布，全面展示了DeepSeek人工智能技术在农业、制造业、金融、医疗、教育等领域的创新实践。本案例集通过40多个行业应用实例，揭示了DeepSeek如何以数据驱动和智能化解决方案推动行业转型升级，为从业者提供前沿技术落地的参考范本。

2025-03-03 13:36:35 1687

原创一文梳理有效提升RAG效果的方法

在大模型实际落地的时候，存在一些问题，主要集中在以下方面：缺少垂直领域知识：虽然大模型压缩了大量的人类知识，但在垂直场景上明显存在短板，需要专业化的服务去解决特定问题。存在幻觉、应用有一定门槛：在大模型使用上有一些幻觉、合规问题，没有办法很好地落地，配套工作不足，缺乏现成的方案来管理非结构化文本、进行测试、运营和管理等。存在重复建设：各业务孤立摸索，资产无法沉淀，存在低水平重复建设，对公司来说ROI低，不够高效。

2025-03-03 13:06:54 682

原创界内AI大佬强烈推荐| 2025年大模型入门必看这3本书，再难读也要读完

界内AI大佬强烈推荐| 2025年大模型入门必看这3本书，再难读也要读完：《大模型应用开发极简入门》、《大模型基础》、《大规模语言模型：从理论到实践》三本入门大模型书籍。

2025-03-02 00:57:39 645

原创 deepseek+dify零成本部署本地知识库保姆级教程_dify 本地部署

deepseek+dify零成本部署本地知识库保姆级教程

2025-03-02 00:49:03 5498 2

原创几乎是跪着看完AI教母李飞飞的开年巨作！《Agent AI》综述 80 页（附PDf）

斯坦福大学李飞飞、微软研究院首席研究员等联合撰写的论文，这篇 Agent AI 综述一共80页。论文主要核心是很有深度讨论多模态人工智能系统，尤其是智能体 Agent 在物理和虚拟环境中的交互性。这不仅对研究人员，及 AI 领域提供了一个研究路线图，更是 AI领域未来发展的洞见。

2025-02-25 14:15:52 435

原创基于DeepSeek，构建个人本地RAG知识库

经过一段使用DeepSeek后，感觉使用体验和ChatGPT基本差不多，回答问题的质量略有提升，因DeepSeek已开源，它的模型、模型参数权重从网上都可以下载到，所以可以基于开源的模型，在本地构建一个自己的知识库，小编这里使用的是蒸馏后的模型参数权重RAG （Retrieval-Augmented Generation）检索增强生成，是一种通过整合外部知识库来增强大模型（LLM）回答问题质量的模式。最简单的理解，可以认为是给大模型外挂了一个知识库。

2025-02-25 14:06:40 935

原创 2025面试必备！这份大模型（LLMs）面试辅助资料，助你轻松拿下心仪offer

在这个竞争激烈的职场环境中，每一次面试都是一次决定你未来职业道路的重要机遇。你是否正在为即将到来的大模型（LLMs）相关面试而焦虑不安？你是否渴望拥有一份全面、系统的面试辅助资料，帮助你轻松应对各种面试问题？

2025-02-24 18:10:46 912

原创中文大模型微调天花板！110K DeepSeek-R1蒸馏数据集发布，性能稳定100%可用！

在如今的大模型微调领域，数据集的获取常常是技术人员面临的一个重大挑战。尽管微调工具和软件越来越容易获得，但数据集的收集工作却常常让人头疼，尤其是对那些缺乏时间和资源的团队而言。今天，我们要分享一个极具价值的中文大模型微调数据集，来自DeepSeek的蒸馏版本，经过精心筛选和清洗，现已开源，供大家直接下载使用。

2025-02-24 18:05:37 946

原创 AI时代，作为一个普通程序员，应该学习哪些 AI 技术？

作为一名普通程序员，想要提高自己在AI领域的竞争力，学习相关的大模型技术是非常重要的。下面将介绍一些关键的AI大模型技术领域，以及如何通过这些技术提升你的技能和职业前景。

2025-02-20 11:00:02 1271

原创 2025年开篇｜AI Agent与多模态大模型：智能革命的新纪元

2024年，AI能力不断进化，各类AI应用也遍地开花，理解语义、生成高质量文本内容已成常态，AI情感陪伴与人类“共情”，AI助手为几百页英文判决做摘要，视频生成模型的高歌猛进使得AI闯入电影制作领域……如果说2023年是百模大战、千模大战，那2024年则是应用之战，新一代的AI技术正在开始进入普通人的工作与生活。

2025-02-20 10:54:39 881

原创值得开发者好好看一看的AI大模型入门教程（内含25最新大模型学习路线+全套学习资料）

无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大，但是相关岗位人才难求，薪资持续走高，AI运营薪资平均值约18457元，AI工程师薪资平均值约37336元，大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向，东学一点西学一点，像只无头苍蝇乱撞，下面是我整理好的一套完整的学习路线，希望能够帮助到你们学习AI大模型。第七阶段：以大模型平台应用与开发为主，通过星火大模型，文心大模型等成熟大模型构建大模型行业应用。

2025-02-19 23:33:34 1091

空空如也

空空如也