- 博客(677)
- 收藏
- 关注
原创 世界级AI大佬吴恩达著作:LLM CookBook 汉化版 本教程
🚀本教程面向入门 LLM 的开发者,深入浅出地介绍了对于开发者,如何构造Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能,是入门 LLM 开发的经典教程;
2025-04-01 23:23:33
685
原创 图解大模型训练之:数据并行(DP、DDP、ZeRO、零冗余优化)
1、在DP中,每个GPU上都拷贝一份完整的模型,每个GPU上处理batch的一部分数据,所有GPU算出来的梯度进行累加后,再传回各GPU用于更新参数2、DP多采用参数服务器这一编程框架,一般由若个计算Worker和1个梯度聚合Server组成。Server与每个Worker通讯,Worker间并不通讯。因此Server承担了系统所有的通讯压力。基于此DP常用于单机多卡场景。3、异步梯度更新是提升计算通讯比的一种方法,延迟更新的步数大小决定了模型的收敛速度。
2025-04-01 23:19:24
591
原创 程序员末日?AI大模型已替代45%岗位!2025年自救指南速看
无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-04-01 23:16:34
982
原创 做完RAG图片搜索后,才明白过去对RAG的理解完全不够
简单来说,图片RAG是一种将图像检索与生成模型结合的技术。它的核心思想是:先从海量数据中检索出与用户输入最相关的图像或信息,再将这些检索结果作为上下文,输入到生成模型中,输出高质量的响应。
2025-03-27 23:14:27
932
原创 【2024医疗人工智能报告】|《2024年医疗人工智能研究报告-生成式AI爆发,医疗人工智能走到新的十字路口》||(附下PDF)_2024医疗健康ai大模型行业研究报告
导读《2024年医疗人工智能研究报告》由蛋壳研究院发布,深入探讨了医疗人工智能在2024年的发展现状与未来趋势。报告指出,随着大语言模型和生成式AI技术的快速发展,医疗领域的多个场景如互联网医疗、医学影像、新药研发等正经历重塑,释放出前所未有的价值。然而,同时强调,在融资形势严峻的背景下,医疗AI企业必须全面考量场景、技术、风控、商业化等多方面因素,以实现决策的精准性。研究核心聚焦于“场景”与“产品”,通过分析医院、药企、械企的供需逻辑和实战案例,为AI企业在布局、选品、研发、商业化方面提供参考建议。
2025-03-27 23:06:35
429
原创 厦大团队:DeepSeek大模型及其企业应用实践(150页PPT,企业人员的大模型宝典)
12025年春节期间,DeepSeek的发布震撼全球,标志着人工智能大模型进入“普惠”时代,大模型开始深刻影响我们工作和生活的方方面面。每个人都有必要学习、了解和使用大模型。你是否渴望揭开大模型的神秘面纱?厦大团队带着满满诚意,重磅推出 4 个大模型科普报告!面向社会大众,我们用 140 页 PPT 深入浅出地讲解大模型概念、技术与应用实践,让每个人都能轻松读懂大模型。对高校而言,120页PPT深度剖析 DeepSeek 大模型如何赋能教学与科研,为学术创新注入新动力。
2025-03-25 22:12:42
277
原创 抖音电商如何用 Agent 重做智能客服?一键获取同款!
在传统电商客服体系中,服务流程通常由智能客服系统与人工客服团队协同完成,并衍生出一系列前后端的配套服务。尽管大模型已经诞生近两年半,目前 AI 客服大都还停留在 SOP 辅助模式或 Copilot 协作模式。“不配置就回复不了”、“机械式单轮问答”、“幻觉问题误导客户”、“无法识别判读意图,答非所问”等问题仍然普遍存在。为了让 AI 客服更智能化,,在 AI 客服场景构建了人机协作的新型服务范式。当前主流智能客服系统通常采用的服务流程为:用户自主查询→机器人应答→转接人工。
2025-03-25 22:03:24
1015
原创 2025年最火技术岗来袭:大模型应用开发工程师,你准备好了吗?
无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-03-23 00:02:25
901
原创 一文彻底搞懂大模型-RAG
一、 检索增强生成(RAG)什么是RAG?RAG(Retrieval-Augmented Generation,检索增强生成),RAG是一种 AI 框架,它将传统信息检索系统(例如数据库)的优势与生成式大语言模型 (LLM) 的功能结合在一起。LLM通过将这些额外的知识与自己的语言技能相结合,可以撰写更准确、更具时效性且更贴合具体需求的文字。什么是RAG?如何理解RAG? 通过上一个问题,我们知道了什么是RAG?了解到RAG是一种结合了信息检索、文本增强和文本生成的自然语言处理(NLP)的技术。RAG的目的
2025-03-21 10:52:40
1074
原创 小白也能微调大模型:LLaMA-Factory使用心得_llama factory
大模型火了之后,相信不少人都在尝试将预训练大模型应用到自己的场景上,希望得到一个垂类专家,而不是通用大模型。目前的思路,一是RAG(retrieval augmented generation),在模型的输入prompt中加入尽可能多的“目标领域”的相关知识,引导模型在生成时尽量靠拢目标领域,运用prompt中给予的目标知识;二是有监督微调,用适量的专业领域的数据(或混通用语料)让模型更能生成目标场景的内容。本文主要讲的就是微调。
2025-03-17 23:52:12
797
原创 2025大模型时代已至,产品经理如何紧跟时代步伐?
在数字化浪潮的推动下,人工智能领域正迎来一场技术革命,而大模型技术的崛起无疑是这场革命中的明星。作为产品经理,我们不仅要洞察市场趋势,更要紧跟技术发展,以创新的思维和敏锐的洞察力,引领产品走向未来。本文将探讨大模型技术的市场现状,以及产品经理如何入行大模型,共同开创智能新时代。大模型技术的崛起为产品经理提供了巨大的机遇和挑战。作为产品经理,我们要紧跟时代步伐,深入了解大模型技术,洞察市场需求,打造创新产品,并组建专业团队支持产品的研发和迭代。只有这样,我们才能在这个充满机遇和挑战的时代中立足并取得成功。
2025-03-17 23:50:36
783
原创 在自然语言处理(NLP)任务中,怎么处理数据——即怎么把文字输入到模型中进行处理?
文本序列化是自然语言处理任务的前置条件,而文本序列化需要经过分词,构建词汇表和序列化的几个步骤**”**在神经网络或者说在机器学习领域中,数据主要以向量的形式存在,表现形式为多维矩阵;但怎么把现实世界中的数据输入到神经网络中是机器学习的一个前提。但我们也知道,计算机只认识数字,而不认识文字和图片;因此,就需要把这些数据转换为计算机能够识别的格式;而在神经网络模型中就是怎么把这些数据转换为向量的格式。简单来说,就是把现实世界中的数据转化为用多维矩阵进行表示的过程。
2025-03-14 22:34:57
900
原创 2025大模型算法方,实习会经常提问哪些问题? ?_大模型算法面试要刷算法题吗
现互联网研发一枚,曾拿过多个算法/研发岗SP offer,简要介绍一下大模型算法岗面试内容和如何准备面试。大模型算法岗的面试内容,实际上可以拆解成两部分,一是算法岗通用的面试内容,二是大模型专有相关部分。算法岗通用面试内容这部分内容很重要,因为通用的面试内容可以适用于不同的研发岗,包括算法、后端开发、数据开发等等,可以“一稿多用”;此外这部分基础掌握的好,也能给面试官留下基础扎实、高潜力的印象。通用的面试内容,通常分为个人经历介绍、手撕代码、原理考察、创新性问题几部分。
2025-03-14 22:30:07
1111
原创 大模型部署全攻略!手把手教你部署开源 DeepSeek,告别访问受限困扰!
大模型正在重塑我们的学习和工作方式,不管你是选择使用 DeepSeek 还是自己部署大模型,最重要的是。近年来,大模型技术突飞猛进,全球各大科技公司纷纷投入研发,形成了一系列成熟的主流大模型。以下是目前国内外最具代表性的大模型:
2025-03-11 21:10:51
1001
原创 风口出现!我国AI人才缺口达500万人
它打破了以往 AI 在功能和应用场景上的局限,具有跨领域协同的能力,能够在多个领域发挥作用,从办公场景中的文档处理、数据分析,到教育领域的教学辅助、个性化学习方案制定,再到金融领域的股票分析、投资策略制定等,都不在话下,堪称人们工作与生活中的得力 “数字助手”。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。
2025-03-11 21:02:35
1100
原创 揭露大模型本质,2025大模型入门必看的12本书!看完我直接跪了_大模型学习书籍推荐
随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来。本书从AI的本质出发,介绍AI技术过往的发展历程和最新的理论成果,然后讲解如何站在移动互联网和大数据的基础上,系统地学习、应用AI技术。本书希望向读者提供学习AI技术的资料、路径,以及打磨AI产品的观点、思路。此外,本书通过介绍笔者接触、打磨AI产品的实际经历,给大家指出AI赋能过程中需要避免的“坑”,期待我们在AI时代共同发展自己、发展生活,在未来遇到更好的AI产品、更好的自己。
2025-03-10 14:09:11
694
原创 LaRA: RAG与长上下文LLM到底哪个更好
通过对七种开源和四种专有LLMs的系统性评估,我们发现RAG与LC之间的最优选择取决于模型参数规模、长文本处理能力、上下文长度、任务类型及检索片段特征等多重因素的复杂交互。我们的研究发现为实践者提供了切实可行的指导,助其在开发和部署LLM应用时有效利用RAG与LC方法。
2025-03-10 13:52:51
938
原创 DeepSeek带火AI大模型岗!急招岗年薪百万,人才缺口将达400万(附大模型教程)
正值年后跳槽高峰期,近期大火的国产AI大模型——DeepSeek发布的一系列高薪招聘信息在各大平台刷屏,阅读量上亿。微博热搜看来,今年春节期间DeepSeek的横空出世,不仅点燃了资本市场,更是引爆了AI人才市场。阿里的钉钉软件、华为的AI平台接连官宣全面接入DeepSeek系列模型,更有业内人士预测,未来五年,AI人才缺口将高达400万!互联网红利逐渐消退,AI领域立刻接棒,开启新一轮“造富神话”。根据脉脉发布的《2024年度人才迁徙报告》显示,《2024年度人才迁徙报告》部分内容。
2025-03-05 23:49:05
815
原创 利用langchain-ChatGLM、langchain-TigerBot实现基于本地知识库的问答应用_langchain 本地知识库
刷B站的时候,无意中看到吴恩达的一个langchain的教程,然后去github上搜了下,发现别人利用langchain和chatGLM做的基于本地知识库的问答应用挺好的,学习下,同时增加了利用langchain-TigerBot实现的本地知识库。
2025-03-05 23:40:47
653
原创 浙江大学|153页《DeepSeek行业应用案例集》也来啦,DeepSeek居然已渗透到千行百业如此之深!(附下载方法)
《DeepSeek行业应用案例集:解锁智能变革密码》由浙江大学信息技术中心发布,全面展示了DeepSeek人工智能技术在农业、制造业、金融、医疗、教育等领域的创新实践。本案例集通过40多个行业应用实例,揭示了DeepSeek如何以数据驱动和智能化解决方案推动行业转型升级,为从业者提供前沿技术落地的参考范本。
2025-03-03 13:36:35
1687
原创 一文梳理有效提升RAG效果的方法
在大模型实际落地的时候,存在一些问题,主要集中在以下方面:缺少垂直领域知识:虽然大模型压缩了大量的人类知识,但在垂直场景上明显存在短板,需要专业化的服务去解决特定问题。存在幻觉、应用有一定门槛:在大模型使用上有一些幻觉、合规问题,没有办法很好地落地,配套工作不足,缺乏现成的方案来管理非结构化文本、进行测试、运营和管理等。存在重复建设:各业务孤立摸索,资产无法沉淀,存在低水平重复建设,对公司来说ROI低,不够高效。
2025-03-03 13:06:54
682
原创 界内AI大佬强烈推荐| 2025年大模型入门必看这3本书,再难读也要读完
界内AI大佬强烈推荐| 2025年大模型入门必看这3本书,再难读也要读完:《大模型应用开发极简入门》、《大模型基础》、《大规模语言模型:从理论到实践》三本入门大模型书籍。
2025-03-02 00:57:39
645
原创 几乎是跪着看完AI教母李飞飞的开年巨作!《Agent AI》综述 80 页(附PDf)
斯坦福大学李飞飞、微软研究院首席研究员等联合撰写的论文,这篇 Agent AI 综述一共80页。论文主要核心是很有深度讨论多模态人工智能系统,尤其是智能体 Agent 在物理和虚拟环境中的交互性。这不仅对研究人员,及 AI 领域提供了一个研究路线图,更是 AI领域未来发展的洞见。
2025-02-25 14:15:52
435
原创 基于DeepSeek,构建个人本地RAG知识库
经过一段使用DeepSeek后,感觉使用体验和ChatGPT基本差不多,回答问题的质量略有提升,因DeepSeek已开源,它的模型、模型参数权重从网上都可以下载到,所以可以基于开源的模型,在本地构建一个自己的知识库,小编这里使用的是蒸馏后的模型参数权重RAG (Retrieval-Augmented Generation)检索增强生成,是一种通过整合外部知识库来增强大模型(LLM)回答问题质量的模式。最简单的理解,可以认为是给大模型外挂了一个知识库。
2025-02-25 14:06:40
935
原创 2025面试必备!这份大模型(LLMs)面试辅助资料,助你轻松拿下心仪offer
在这个竞争激烈的职场环境中,每一次面试都是一次决定你未来职业道路的重要机遇。你是否正在为即将到来的大模型(LLMs)相关面试而焦虑不安?你是否渴望拥有一份全面、系统的面试辅助资料,帮助你轻松应对各种面试问题?
2025-02-24 18:10:46
912
原创 中文大模型微调天花板!110K DeepSeek-R1蒸馏数据集发布,性能稳定100%可用!
在如今的大模型微调领域,数据集的获取常常是技术人员面临的一个重大挑战。尽管微调工具和软件越来越容易获得,但数据集的收集工作却常常让人头疼,尤其是对那些缺乏时间和资源的团队而言。今天,我们要分享一个极具价值的中文大模型微调数据集,来自DeepSeek的蒸馏版本,经过精心筛选和清洗,现已开源,供大家直接下载使用。
2025-02-24 18:05:37
946
原创 AI时代,作为一个普通程序员,应该学习哪些 AI 技术?
作为一名普通程序员,想要提高自己在AI领域的竞争力,学习相关的大模型技术是非常重要的。下面将介绍一些关键的AI大模型技术领域,以及如何通过这些技术提升你的技能和职业前景。
2025-02-20 11:00:02
1271
原创 2025年开篇|AI Agent与多模态大模型:智能革命的新纪元
2024年,AI能力不断进化,各类AI应用也遍地开花,理解语义、生成高质量文本内容已成常态,AI情感陪伴与人类“共情”,AI助手为几百页英文判决做摘要,视频生成模型的高歌猛进使得AI闯入电影制作领域……如果说2023年是百模大战、千模大战,那2024年则是应用之战,新一代的AI技术正在开始进入普通人的工作与生活。
2025-02-20 10:54:39
881
原创 值得开发者好好看一看的AI大模型入门教程(内含25最新大模型学习路线+全套学习资料)
无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2025-02-19 23:33:34
1091
原创 DeepSeek + Dify :零成本搭建企业级本地私有化知识库保姆级喂饭教程
DeepSeek作为可以私有化本地部署的大模型,加上Dify这个组合,我们还可以有很多其他应用场景,比如:智能客服,智能题库。也可以把自己的个人资料,过往输出文章,日记等所有个人信息上传到本地知识库,打造自己的私人助理。Dify还有很多其他功能,有了deepseek这样的优秀国产AI大模型加持,我们可以做更多智能体应用。当然,Dify也可以像coze一样,发布为对外服务的api,这样,它就可以结合cursor快速做出更多的AI应用。何以破局,唯有行动!
2025-02-19 23:24:57
3672
2
原创 2024年中国大模型行业应用优秀案例|附34页PDF文件下载
日前,国际权威咨询机构弗若斯特沙利文发布《2024年中国大模型行业应用优秀案例白皮书》,在人工智能技术飞速发展的背景下,AI大模型已成为推动各行各业智能化升级的关键力量。企业用户对大模型的专业性、安全性、稳定性和持续性提出了更高要求。
2025-02-18 11:32:14
960
原创 DeepSeek大模型企业私有化部署解决方案
当使用企业内部数据来训练和优化 AI 模型时,数据安全与业务创新之间潜在的矛盾逐步浮现。国内外公共平台虽提供了便捷的服务和充足的算力支撑,但在敏感数据传输和处理过程中,私有化的部署模式却能让安全性、隐私性、合规性得到更充分的保障,有效规避数据泄露风险。目前,借助 DeepSeek 灵活的模型蒸馏机制,可显著降低初期成本投入,加速AI大模型在企业内的落地进程。私有化大模型服务平台为企业提供基于主流大模型的智能化解决方案。构建企业,实现AI精准检索,大幅提升信息查找效率,降低人力成本。通过。
2025-02-18 11:19:58
997
原创 大模型概念、技术与应用实践(140页PPT读懂大模型)| 厦大团队(附pptx原文下载)
在数字化浪潮汹涌澎湃的当下,大模型如同一颗璀璨新星,强势崛起并迅速成为科技领域的焦点。从最初的理论探索到如今在各个行业的广泛应用,大模型正以惊人的速度重塑着我们的生活与工作模式。它不仅是人工智能技术发展的重大突破,更是推动经济增长、提升社会治理效能、促进科技创新的关键力量。本报告将深入剖析大模型的核心概念、原理特点以及丰富多元的应用实践案例,旨在让大家全面了解大模型这一前沿技术,明晰其在当下及未来发展中的重要地位与深远影响 ,共同探索如何借助大模型的力量推动社会各项事业迈向新的高度。
2025-02-17 11:00:36
1014
原创 步步将DeepSeek R1微调成一个DeepDoctor(资深医生)
DeepSeek 颠覆了 AI 领域,挑战 OpenAI 的主导地位,推出了一系列先进的推理模型。最令人兴奋的是?这些模型完全免费,且没有任何使用限制,人人都可以访问。在本教程中,我们将对 DeepSeek-R1-Distill-Llama-8B 模型进行微调,使用来自 Hugging Face 的医学思维链数据集进行训练。该精简版 DeepSeek-R1 模型是通过在 DeepSeek-R1 生成的数据上微调 Llama 3.1 8B 模型而创建的。它展示了与原始模型相似的推理能力。
2025-02-17 10:52:45
3738
原创 2025大模型书籍分享(附PDF)大模型时代:ChatGPT开启通用人工智能浪潮
《大模型时代:ChatGPT开启通用人工智能浪潮》这本书书对大模型时代的技术、应用和产业变化进行了深入的分析和阐述。本书首先将专业的技术知识通过拟人化的形式进行呈现,生动形象地解释了ChatGPT大模型背后的原理,对这一赋能大模型变革技术与产业的基础能力进行深度剖析;其次,本书以三次工业革命的历史和逻辑作为参照,描绘出大模型将如何驱动社会进入智能革命和脑机协作时代,并为个人和企业应对此次变革提出建议;
2025-02-14 13:26:45
830
原创 如何用deepseek+RAG搭建FPGA本地知识库
一直在想如何让AI 帮我写FPGA 的代码,分析代码,分析资料,不想一直重复造轮子。自从openAI 火爆之后,就一直在探索这条路,以至于求着给它送了不少银子。这是openAI 刚推出GPT Store功能的时候,我就做了一个AI 智能助手,上传自己的私有代码。但是效果一般。后来字节的 coze 出来了,我又用coze做了一个 FPGA 智能体。采用多个大模型进行需求重审,代码重审,最后总结输出。并且接入了自己的这个公众号后台,效果也是很一般。
2025-02-14 13:23:12
1216
1
原创 可能被你严重低估的AI世界DeepSeek,2025年AI大模型是普通人集体逆转的天大机遇
最近DeepSeek高薪招聘招聘的消息在全网刷屏,高阶岗位开出百万年薪,在赤擎的数据研究库里,Top10的热招岗位接近一半是跟AI相关的。难怪年前麦肯锡的老友说,AI的爆炸,正式开启普通人改写命运。麦肯锡的权威报告指出,到2030年,AI产业将为中国带来潜在的超过1万亿美元的超级大市场。对于就业的人而言,这无疑是绝好的职业赛道,而对于普通人更为重要的是,在未来AI的大爆炸不可阻挡的趋势下,都将迎来所在行业的巨大变革。
2025-02-13 10:26:20
1436
原创 手把手教你用 DeepSeek 构建知识库,打造专属智能助手!
DeepSeek R1 发布后,风靡全球。在除了印度外的 100 多个国家下载量排名第一。用户访问量太大+各种外部原因,官网也光荣地倒下了。这两天经常处于瘫痪状态,是不是给你来个服务器繁忙,请稍后再试,太崩溃了,极其影响效率。硅基流动的 API 总算是上线了,这是目前为数不多的稳定、高速、满血版的DeepSeek R1 API,效果非常好。再也没有看到动不动服务器繁忙,请稍后再试的问题了。接下来,利用DeepSeek+知识库,构建个性化的智能体。如果你是零基础小白,想快速入门大模型是可以考虑的。
2025-02-13 10:18:17
766
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人