- 博客(771)
- 收藏
- 关注
原创 大模型学习路线(超全面!超详细!)收藏这一篇就够了!
近年来,深度学习技术的快速发展推动了大模型在学术界和工业界的广泛应用。大模型通常具有数亿到数十亿的参数,能够处理复杂任务,但也对计算资源和数据量提出了更高要求。学习大模型需要掌握深度学习基础、编程技能(如Python)、深度学习框架(如TensorFlow或PyTorch)以及特定领域知识(如自然语言处理、计算机视觉等)。此外,理论基础、实践经验和持续学习也是关键。大模型的出现得益于数据丰富性和计算资源的提升,尽管面临训练时间长、资源需求高等挑战,其在多个领域的卓越表现使其成为深度学习的重要方向。
2025-05-15 21:41:39
799
原创 大模型在智能客服领域的应用思考
大模型技术在智能客服领域的应用前景广阔,尤其是在呼入和呼出场景中展现了显著潜力。在呼入场景中,大模型可以通过生成相似问题库提升问答机器人的识别准确率,同时利用其主题抽取能力自动生成话务小结,减少人工操作,提高效率。此外,大模型还能通过生成提示性短语和增强检索功能,优化多轮对话的处理,提升客户体验。在呼出场景中,大模型可以根据用户属性标签定制个性化外呼策略,提升转化率。总体而言,大模型在智能客服中的应用有望显著降低运营成本,提升服务质量和效率。
2025-05-15 16:53:26
1014
原创 大模型技术:基于大模型构建本地知识库!
随着人工智能技术的进步,大模型在智能系统中扮演着关键角色,但在特定场景下仍面临响应速度和准确性的挑战。为此,构建基于大模型的本地知识库成为解决方案。本地知识库专注于特定领域,提供精确信息支持,通过数据采集、知识处理、检索与推荐引擎及Web展示层等模块,实现高效的知识管理和智能问答。利用大模型的语义理解和文本生成能力,结合检索增强生成(RAG)技术,本地知识库能够提升系统的智能性和效率。此外,Streamlit框架和LangChain接口的引入,进一步简化了开发流程,增强了系统的实时更新和自然语言处理能力。通
2025-05-15 15:39:48
900
原创 或许是全网最全的 DeepSeek 使用指南,90% 的人都不知道的使用技巧
从 DeepSeek R1 发布那天开始,我就开始写文章介绍 DeepSeek,没想到这几天这么火爆了。不过我在翻看评论区时,发现很多朋友并没有很好的发挥出 DeepSeek R1 的潜能。朋友们,我真是着急啊。心急之下,赶紧写了这篇文章,教大家一些有用的技巧,并提供一些案例,来让 DeepSeek R1 成为咱们的得力干将。为照顾一些新手朋友,这里还是先说下在哪使用 DeepSeek,老手跳过这部分就行了。
2025-05-13 15:43:32
1563
原创 Open-WebUI上DeepSeek-R1本地部署全攻略:高效使用技巧
本文介绍了如何在Tesla P40显卡上部署DeepSeek-R1模型,由于该显卡不支持官方推荐的vllm、ollama和SGLang部署方式,作者选择使用fastapi编写接口服务,使老显卡重新发挥作用。文章详细说明了官方部署方式(适用于支持vllm的显卡)以及使用docker镜像安装open-webui的步骤。作者还分享了开发DeepSeek-R1服务API的关键代码,并提到流式输出时遇到的bug,最终通过屏蔽yield实现非流式返回。文末提供了大模型AGI-优快云独家资料包。
2025-05-13 15:17:11
1201
原创 2024年史上最难就业季,该如何逆风翻盘?
【2024年被称为最难就业年,1158万大学生面临难题】IT互联网依然是大学生最向往行业,制造业受欢迎度升高智联招聘调研数据显示,2024届求职毕业生期望行业中,IT/通信/电子/互联网、政府/非盈利机构、文化/传媒/娱乐/体育行业位列前三,占比分别为26.4%、9.4%、8.9%。IT互联网行业为应届生贡献很多就业岗位,也是应届生最向往的行业。前排提示,文末有大模型AGI-优快云独家资料包哦!所以在今年找工作,面临2024年史上最难就业季,该如何成功逆袭呢?
2025-05-13 14:58:27
673
原创 LORA 微调大模型:从入门到入土,零基础入门到精通,看这篇就够了!
在人工智能领域,预训练大模型虽强大,但直接应用于特定任务时往往表现不佳,此时微调成为关键步骤。其中,LORA(Low-Rank Adaptation)因其高效性和实用性,成为开发者首选。本文详细介绍了LORA微调的全过程,包括硬件与环境的配置、数据处理的工程化实践、LORA技术的数学本质与实战配置策略、训练过程的精细化控制、过拟合问题的解决方案以及大模型部署的工业级实践。此外,还提供了持续优化建议和针对0基础小白的大模型学习资料,帮助读者从入门到精通,成为LORA微调的骨灰级玩家。
2025-05-13 14:34:42
691
原创 AI大模型应用入门实战与进阶:如何训练自己的AI模型
本文介绍了AI大模型的训练与应用,涵盖了核心概念、算法原理、代码实例及未来发展趋势。AI大模型如GPT-3、BERT等在自然语言处理、计算机视觉等领域取得了显著成果,但其训练过程复杂,需大量计算资源和专业知识。文章详细讲解了卷积神经网络(CNN)、递归神经网络(RNN)和变压器(Transformer)等模型的核心概念及其联系,并阐述了模型训练的步骤,包括数据预处理、模型构建、训练、验证、测试和部署。此外,还介绍了梯度下降、批量梯度下降、学习率衰减和正则化等优化策略,以及损失函数、梯度下降公式等数学模型。最
2025-05-12 15:49:38
852
原创 大模型技术基础学习路线,想要学好大模型应该具备哪些能力?
大模型技术的学习是未来在该领域立足的关键。学习大模型技术主要分为两个方向:使用工具和制造工具。本文重点探讨如何制造大模型工具,涉及的技术基础包括理论基础、编程基础、深度学习框架、特定领域知识、实践经验和算法基础。理论基础是技术发展的基石,涵盖人工智能、机器学习、深度学习等概念。编程基础以Python为主,深度学习框架如PyTorch和TensorFlow则简化了开发过程。特定领域知识如自然语言处理和计算机视觉与大模型结合,提升了研究效率。实践经验是掌握技术的关键,理论与实践相结合才能深入理解技术本质。算法基
2025-05-12 14:59:42
734
原创 一文彻底搞懂大模型 - Agent(智能体)
电影《钢铁侠》中的智能助手J.A.R.V.I.S.展示了未来AI Agent的潜力,它不仅能处理复杂数据,还能理解并执行指令,甚至提供关键建议。基于大型语言模型(LLM)的AI Agent正逐步从银幕走进现实,成为生活与工作中的重要助手。LLM Agent具备环境感知、自主理解、决策制定及执行行动的能力,其架构包括规划、记忆、工具与行动四大关键部分。通过RAG技术,LLM Agent能够查询外部知识库,增强其知识广度和深度。例如,财报分析Agent可以自动化完成数据收集、分析与报告生成,具体步骤包括需求分析
2025-05-12 14:34:01
827
原创 大白话讲解: Agent、 LLM 、RAG 、提示词工程
智能体(Agent)是AI中的虚拟员工,能够自主观察环境、思考对策并调用工具完成任务,与传统AI相比,智能体更灵活,能够应对复杂情况。大语言模型(LLM)如ChatGPT,通过海量文本预训练掌握语言规律,但存在“幻觉”问题,即对未训练数据可能产生错误回答。检索增强生成(RAG)通过为AI提供外部知识库,减少其“幻觉”现象,提升回答准确性。提示词工程则是与AI有效沟通的关键,明确的任务描述能显著提高AI的输出质量。这些技术共同协作,可以开发出如旅游规划AI等复杂应用,其中LLM负责理解需求,RAG提供数据支持
2025-05-10 22:17:12
623
原创 一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI的区别和联系!!
当我们把AI大模型视作人的大脑时,调用A大模型就如同调用一个人的智慧。将AI大模型人格化,意味着它应该能够理解人类的语言(懂人话)、用人类的语言进行表达(说人话),并直接给出结果。然而,重要的是要认识到,尽管AI大模型可以提供快速的答案,但这些结果并不总是完全准确。在AI大模型的推理基础上,我们采用了多种技术手段来实现真正的AGI(通用人工智能),这些技术包括Prompt、RAG、Agent、知识库、向量数据库和知识图谱等。这些技术各自有其独特的作用和优势,但同时也相互关联,共同推动着AGI的发展。
2025-05-10 21:34:50
908
原创 基于RAG模型的智能问答系统研究
检索增强生成(RAG)模型结合了信息检索和生成模型的优势,显著提升了智能问答系统的性能。本文详细介绍了RAG模型的历史背景、工作原理、优势与局限性,并展示了如何基于开源RAG模型构建医疗健康领域的智能问答系统。通过检索相关文档并结合生成模型,RAG能够提供更准确、信息丰富的答案。然而,RAG模型也面临计算资源需求高、实时性差、文档库依赖等挑战。本文提供了构建RAG系统的详细步骤和代码示例,并探讨了优化方案,如使用高效检索技术和定期更新文档库。未来研究可进一步优化RAG模型,提升其在复杂任务中的适应性。
2025-05-10 17:37:20
673
原创 【实战项目】手把手教你构建自己的RAG应用:从零开始,全面指南!
RAGRAG 是一个人工智能框架,用于从外部知识库中检索事实,使大型语言模型(LLM)基于最准确的最新信息,并让用户深入了解 LLM 的生成过程。大语言模型训练完后,其内部知识库就已经确定了,所以它无法回答你超过其知识库内容的问题。除非你有能力对其进行微调,否则最简单的方法就是使用RAG检索外部知识库。有人可能会认为,RAG是不是就是让模型在回答问题前先去指定的外部知识库检索一下知识,然后再回答?
2025-05-08 15:29:17
893
原创 大模型+RAG构建知识问答助手入门到精通,收藏这一篇就够了!
知识问答助手已经成为企业在探索大模型应用时的首选场景之一,基于大模型的知识问答助手不仅能够自动整合企业内外部的海量信息,构建全面、精准的知识图谱,还能够通过自然语言查询,实现一键触达精准答案。大模型存在幻觉问题、可解释性差、隐私和安全问题等明显缺点,为了提高知识问答的准确率,一种基于“大模型+RAG(检索增强生成)”架构的方式正在形成。RAG的本质是在大模型交互之前提前进行搜索,召回正确的上下文给到大模型,决定了大模型生成的天花板。
2025-05-08 15:01:01
735
原创 保姆级教程:DeepSeek+RAG技术实现企业级知识库搭建
检索(Retrieval) 的详细过程:准备外部知识库: 外部知识库可能来自本地的文件、搜索引擎结果、API等等通过 Embedding (嵌入) 模型,对知识库文件进行解析: Embedding 的主要作用是将自然语言转化为机器可以理解的高维向量,并且通过这一过程捕获到文本背后的语义信息(比如不同文本之间的相似度关系)通过 Embedding(嵌入) 模型,对用户的提问进行处理: 用户的输入同样会经过嵌入(Embedding)处理,生成一个高维向量。
2025-05-08 14:29:31
842
原创 大模型教程:RAG 知识库高效应用指南(附教程)
构建一个RAG 应用的概念验证过程相对简单,但要将其推广到生产环境中则会面临多方面的挑战。这主要是因为 RAG 系统涉及多个不同的组件,每个组件都需要精心设计和优化,以确保整体性能达到令人满意的水平。
2025-05-08 14:12:27
732
原创 哪个最适合企业搭建AI知识库,让沉淀的企业知识活起来
2023年被誉为元年,。AIGC概念广泛,其中生成式AI技术(Generative AI)尤其受到关注,它通过创新性算法解决传统AI所难以触及的问题,特别是在数字内容创新上实现了质的飞跃。
2025-05-07 16:58:31
1077
原创 手把手教你从零搭建自己的知识库
Word2Vec是一种用于处理自然语言处理的模型,它是在2013年由Google的研究员Mikolov等人首次提出的。Word2Vec通过训练海量的文本数据,能够将每个单词转换为一个具有一定维度的向量。这个向量就可以代表这个单词的语义。因为这个向量是在大量语境中学到的,所以这个向量能很好的表达这个单词的语义。Word2Vec包括Skip-Gram和CBOW两种模型,主要是通过优化模型计算词与词之间的关系,从而获得词的向量表示。Skip-Gram模型是通过一个词预测其上下文。
2025-05-07 15:39:26
1260
原创 使用AI大模型的正确姿势!接入知识库、微调,5种方法,总有一种适合你
真正的魔力在于结合这些方法:提示词、RAG、微调、切换模型和使用多模态大模型。利用每种方法的优势,并将其应用于文本和图像数据,以此用大模型提升你的生产力。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型。
2025-05-07 14:52:38
931
原创 什么是AI大模型?(超详细)大模型从入门到精通,看这一篇就够了
大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。
2025-05-06 16:42:19
1779
原创 大模型技术,基于大模型构建本地知识库!
模型以其庞大的数据容量和深度学习能力,为处理复杂任务提供了前所未有的可能性。但在特定应用场景下仍面临挑战,尤其是在需要快速、准确响应的情境中。为了克服这些限制,构建一个基于大模型的本地知识库显得尤为重要。
2025-05-06 15:54:34
972
原创 本地大模型部署和基于RAG方案的私有知识库搭建
以上就是本地大模型部署和基于RAG方案的私有知识库搭建的基本操作。除此之外,还有更多丰富有趣的功能等待探索。如今大模型遍布各行各业、各个领域,基于RAG方案的私有知识库技术也逐渐发展,成为提升个人工作效率与创造潜能的新风尚。本地部署模型意味着用户能在自己的设备上享受即时响应的智能辅助,无需依赖云端,既保护了个人数据隐私,又确保了操作的低延迟与高可靠性。结合RAG方案的私有知识库,则让每位用户能够构建专属自己的知识宇宙。
2025-04-28 17:11:06
1196
原创 如何搭建基于大模型的智能知识库
基于RAG与LLM的知识库作为目前最有潜力的企业端大模型应用之一,从技术角度可以看到,建设方案已经完备;从业务角度,最终的应用效果和业务价值还需要观察,并通过业务侧的反馈不断地促进建设方案的进一步优化,比如增加对多模态知识的处理能力等。让我们共同期待这类应用普及那一天的到来。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。
2025-04-28 17:01:53
973
原创 大模型经典面试题,(非常详细)收藏这一篇就够了!
LangChain是一个用于构建和运行大型语言模型应用的开源框架。它提供了一套工具和组件,帮助开发者将大型语言模型(如 GPT-3)与其他工具和API结合,以完成更复杂的任务。1、LangChain包含哪些核心概念?Components:可重用的模块,例如API调用、数据库查询等。Chains:将多个Components链接在一起以完成特定任务的流程。Prompt Templates: 用于指导语言模型生成输出的文本模板。Output Parsers:解析语言模型输出的工具。
2025-04-28 16:40:49
643
原创 2025大模型面试宝典:20个精选问题及解答,存下吧很难找齐的!
大型语言模型(LLM)是一种通过大量文本材料训练的人工智能系统,能够像人类一样理解和生成语言。通过使用机器学习技术识别训练数据中的模式和关联,这些模型能够提供逻辑上和上下文上适当的语言输出。
2025-04-28 16:07:39
1019
原创 2025年医疗大模型如何发展?私有化部署是重要方向
导读一方面,大模型在医疗场景应用需兼顾安全性与专业性,可通过数据清洗、标注和验证等控制数据质量;另一方面,大模型的计算需要大量的算力作为支撑,轻量化、本地化部署的大模型将成为重要发展方向。2023年被很多人称为“医疗大模型的元年”,国内外均有大量厂家将大语言模型应用于医疗健康领域。据统计,截至2023年10月,我国累计公开的大模型数量已经达到238个,垂直类大模型达到103个。而2-9月,我国发布的医疗大模型近50个,涉及智慧诊疗、医疗文本处理、药物研发和学术科研等多个方面。
2025-04-28 15:51:48
1143
原创 我们为什么要用本地大模型?——本地大模型入门指南
大模型,在2023年主要称之为大型语言模型(Large Language Models),是一种基于人工智能和机器学习技术构建的先进模型,旨在理解和生成自然语言文本。这些模型通过分析和学习海量的文本数据,掌握语言的结构、语法、语义和上下文等复杂特性,从而能够执行各种语言相关的任务。LLM的能力包括但不限于文本生成、问答、文本摘要、翻译、情感分析等。我们最熟悉的大模型,莫过于CHATGPT。但我们最常用的大模型,未必是CHATGPT。
2025-04-27 15:00:41
929
原创 什么是多模态?多模态大模型综述,看这一篇就够了
多模态大型语言模型(Multimodal Large Language Models, MLLM)的出现是建立在大型语言模型(Large Language Models, LLM)和大型视觉模型(Large Vision Models, LVM)领域不断突破的基础上的。随着 LLM 在语言理解和推理能力上的逐步增强,指令微调、上下文学习和思维链工具的应用愈加广泛。然而,尽管 LLM 在处理语言任务时表现出色,但在感知和理解图像等视觉信息方面仍然存在明显的短板。
2025-04-27 14:38:05
2349
原创 国内12家主流大模型,谁是地表最强?亲测后发现是它!
大模型GPT-3.5,2022年11月发布。可谓春风化雨,雨后春笋一般。到现在2024年,国产大模型工信部注册的,已有几百家。国产大模型崛起速度之快,令人惊叹。在如此之多的大模型里面,如何选择好用的,还真是个问题。结合GPT4o和Claude3.5,加上自身的一定使用,总结了如下12家国产大模型:下面表格,排名不分先后各自产品对应的logo如下:文字版介绍:1 百度:推出了“文心一言”大模型,具备强大的自然语言处理能力,广泛应用于搜索、对话等领域。
2025-04-27 14:20:25
2957
原创 基于RAGFlow实践Agent——构建智能客服
智能客服的应用场景非常广泛,如商品咨询,售后问答,配件更换,转人工客服等场景。今天将给大家介绍如何使用 RAGFlow 的来搭建一个商品智能客服,实现能够针对上述四种场景给出不同的解决方案。RAGFlow 是一款基于深度文档理解构建的开源 RAG(Retrieval-Augmented Generation)引擎。RAGFlow 可以为不同规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
2025-04-27 14:02:40
906
原创 一文详解大模型微调常用方法,大模型微调数据集怎么标注?
最近,深度学习的研究中出现了许多大型预训练模型,例如 GPT-3、ChatGPT、GPT4、ChatGLM-130B 等,这些模型可以在多种自然语言处理任务中取得优异的性能表现。而其中,ChatGPT 模型因为在对话生成方面的表现而备受瞩目,成为了自然语言处理领域的热门研究方向。然而,这些大型预训练模型的训练成本非常高昂,需要庞大的计算资源和大量的数据,一般人难以承受。这也导致了一些研究人员难以重复和验证先前的研究成果。
2025-04-26 09:15:00
1664
原创 一文说清大模型微调的6种方法!看到就是赚到!!
前排提示,文末有大模型AGI-优快云独家资料包哦!1. 基本概念是在大规模数据上进行无监督或自监督学习训练得到的模型。例如在自然语言处理中,像 BERT(Bidirectional Encoder Representations from Transformers)、GPT(Generative Pretrained Transformer)系列等都是典型的预训练模型。这些模型通过学习大量文本数据中的语言模式、语义信息和语法结构等知识,形成了对语言的深度理解能力。在预训练阶段,模型会接触海量的数据。
2025-04-26 09:00:00
1151
原创 本地部署大模型的几种方式,非常详细,收藏这一篇就行!
开源大模型, 或者说本地化运行一个开源大模型, 现在已经越发的简单与低门槛了. 只要有足够的。
2025-04-25 15:49:50
1135
原创 为何很多企业倾向于私有化部署AI大模型?
最近有人问我:为什么有些企业要求私有化部署AI大模型,难道直接使用大模型产品不香吗?对于这一点,我只能客观地说:两者各有千秋。比如金融、医疗等行业对客户数据和隐私保密性要求非常高,行业私有数据的泄密,很可能给社会及个人带来严重影响,机构自身也会因为信任危机,导致客户灾难性流失,所以这类行业在使用大模型产品时,对私有化训练和部署的需求会相对更高。而他们选择在云上或本地私有化部署模型服务的很大一部分原因,就在于深度保障业务数据传输、存储、训练和使用全流程的安全可控,杜绝潜在风险,让客户更放心。
2025-04-25 15:25:54
949
原创 如何部署私有化大模型+知识库+问答+客服
随着各个大模型厂商的逐步发力,市场上的优秀模型越来越多。Dify基于这些大模型可以简易地创建可持续运营的原生 AI 应用,融合了 Backend as Service 和 LLMOps 的理念,涵盖了构建生成式 AI 原生应用所需的核心技术栈,包括一个内置 RAG 引擎,平台不仅支持十几种大模型的接入,同时提供多种类型应用的可视化编排能力,开箱即用只需十分钟即可轻松在本地服务器上部署。Features。
2025-04-25 15:06:34
1012
原创 大模型RAG详解:检索、增强、生成,一篇文章彻底掌握!
RAG(Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research(FAIR)团队于2020年首次提出,并迅速成为大模型应用中的热门方案。前排提示,文末有大模型AGI-优快云独家资料包哦!一、检索增强生成(RAG)什么
2025-04-25 14:36:50
1020
原创 大模型RAG入门到实战基础教程(非常详细),非常详细保姆级教程!
大模型(Large Language Model,LLM)的浪潮已经席卷了几乎各行业,但当涉及到专业场景或行业细分域时,通用大模型就会面临专业知识不足的问题。相对于成本昂贵的“Post Train”或“SFT”,基于RAG的技术方案往成为一种更优选择。本文从RAG架构入手,详细介绍相关技术细节,并附上一份实践案例。前排提示,文末有大模型AGI-优快云独家资料包哦!本文列举了LLM的问题。简单介绍了什么是 RAG ,以及 RAG 的流程。最后使用了一个简单的LangChain代码示例来展示 RAG 的使用。
2025-04-24 16:18:04
1039
原创 2025最全Transformer面试题汇总(84道题),大模型面试必备!
这篇文案汇总了Transformer模型的基本原理、训练过程、应用场景以及性能优化等多个方面的面试题。
2025-04-24 15:52:07
1031
原创 【2025超全汇总】这是我见过最全面的AI大模型面试题集合!
节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。AI 大模型技术经过2024年的狂飙,2025年必将迎来应用的落地,对 IT 同学来讲,这里蕴含着大量的技术机会,越来越多的企业开始招聘 AI 大模型岗位。
2025-04-24 15:37:29
719
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人