- 博客(517)
- 收藏
- 关注
原创 Llama + Dify,在你的电脑搭建一套AI工作流
最近字节在推Coze,你可以在这个平台制作知识库、制作工作流,生成一个具有特定领域知识的智能体。那么,有没有可能在本地也部署一套这个东西呢?这样敏感数据就不会泄露了,断网的时候也能使用AI。刚好最近Llama 3.1发布了,本文就以Llama 3.1作为基础模型,配合Dify在本地搭建一套“Coze”。跟着本文一步步操作,保证能行!
2025-03-31 22:01:04
883
原创 快速搭建自己的RAG知识库(Ollama、Page Assist、Anything LLM)
先解释一下字面意思:RAG Retrieal-Augmented Generation 检索增强生成。RAG 可以帮助我们减少大模型的“幻觉”问题,还可以注入最新资讯及特定领域的关键信息,是一种低成本(相比于模型微调,肯定是成本低得多)的让大模型知道专业领域知识或者一些隐私数据的手段。首先将我们的知识库(一些专用领域的数据或者隐私数据等,可以是 PDF、CSV、txt、md 等多种格式)分割为文本块。使用 Embedding Model 将文本块转为向量(Vector Embeddings)。
2025-03-31 21:52:44
577
原创 人工智能大语言模型微调技术:SFT 监督微调、LoRA 微调方法、P-tuning v2 微调方法、Freeze 监督微调方法
SFT监督微调时监督微调时,学习率通常会设置得很小常见误区:1.监督微调需要大量的训练时间和数据 2.监督微调将复制源模型的所有参数至目标模型 3.监督微调只需要几十条监督数据即可监督微调常见任务:1.用中文预训练BERT模型完成中文实体识别任务 2.训练语言模型GPT3 3.UIE模型在垂直领域的数据集上微调常见误区:在ImageNet上的预训练的模型再来训练目标检测任务 (则不是)目前,主流的SFT监督方法包括:LoRA、P-tuning v2、Freeze。
2025-03-31 21:33:59
908
原创 大模型新书分享《大模型入门:技术原理与实战应用》文末PDF共享
此外,书中还探索了大模型与智能编程的融合,以及在金融科技、搜索引擎、设计软件等领域的广泛应用,全书旨在为读者提供一套全面的理论框架与实战指南,帮助他们掌握提示工程技术,释放大模型的潜能,应对未来的创新挑战。本书揭示了大模型的工作原理,展示了如何通过精心设计的提示引导大模型产出高质量内容,涵盖了从电子商务、创意营销到内容创作、智能办公、编程和软件生态等多个领域的实践案例,为读者提供了一个全面的技术科普和操作指南,帮助读者掌握与大模型高效协作的方法,挖掘大模型潜力,解决实际问题。程絮森,杨波,王刊良,李浩然。
2025-03-28 15:03:12
1475
原创 LangChain实战 | 路由机制让AI助手更聪明,专业问题交给专业模块!
路由机制是 LangChain 处理复杂任务的核心设计之一,它通过动态调度不同子模块,实现了“专业问题由专家处理”的智能化分工。无论是数学物理问题的精准分类,还是多工具协作场景(如搜索、计算、数据库查询),路由都能显著提升系统的可靠性和效率。
2025-03-28 15:02:03
806
原创 图解 Langchain 金融决策,连续加班只为你打造投资助手
Langchain 就像是一个金融顾问团队,可以帮你分析市场数据、提供投资建议和自动化决策流程。2. 向量存储2. 风险评估3. 投资组合优化2. 金融新闻分析Langchain 库是构建智能金融决策系统的强大工具,可以帮你:哎呀,终于搞定这个投资助手了!加班做完这套系统后,我相信你的投资分析效率会提高不少。不过记住,再智能的系统也只是工具,最终决策还是你自己拍板。开始用起来吧!大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “”“”等问题热议不断。不如成为,毕竟
2025-03-28 14:56:00
792
原创 2025大模型书籍推荐!大模型项目实战:多领域智能应用开发(附PDF)
高强文互链高科(北京)技术发展有限公司总经理,银川方达电子系统工程有限公司董事长,宁夏回族自治区劳动模范。专注于人工智能大语言模型应用开发、开源社区开发与运营。参加工作20多年来,一直从事医疗健康领域信息化、人工智能等产品研发与管理工作,近年来致力于开源事业,开发运营aliendao.cn、gitclone.com和opendao.cn等开源社区,在GitHub上贡献了20多个开源代码库。
2025-03-26 17:20:48
1164
原创 实现知识库问答机器人 langchain + LLM + Embeddings (比Langchain-Chatchat更智能)
如果微调打分模型效果一定会更好。如果每个步骤都使用不同的模型数一数要用多少个模型?
2025-03-24 14:56:48
638
原创 大模型RAG实战:全面讲解RAG技术原理、实战应用(附PDF免费下载书籍)
作者结合自身丰富的实战经验,详细阐述了RAG的基础原理、核心组件、优缺点以及使用场景,同时探讨了RAG在大模型应用开发中的变革与潜力。书中不仅揭示了RAG技术背后的数学原理,还通过丰富的案例与代码实现,引导读者从理论走向实践,轻松掌握RAG系统的构建与优化。第三部分(第7章和第8章)中,我们首先以一个基于LangChain实现 的RAG应用为例,详细介绍了如何搭建一个RAG系统。在第一部分(第1~3章)中,我们首先介绍了RAG的定义,为什么需要 RAG,以及RAG的工作流程、优缺点以及使用场景。
2025-03-24 14:55:14
864
原创 使用llama.cpp实现LLM大模型的格式转换、量化、推理、部署
llama.cpp的主要目标是能够在各种硬件上实现LLM推理,只需最少的设置,并提供最先进的性能。提供1.5位、2位、3位、4位、5位、6位和8位整数量化,以加快推理速度并减少内存使用。
2025-03-24 14:50:56
792
1
原创 Langchain.js| Vue + RAG 实战[特殊字符]| 限制LLM只回答私有数据
学习了 Memory 机制 , 回顾所学 RAG , 总结起来还是下面这张图 ,现在可以初步实现一个小型的 ,基于 RAG 的全栈项目 , 由于我在家无聊 , 和上小学的妹妹一起玩耍🤡👈 , 突发奇想做了一个只能根据知识库回答的 AI 助手 我做了一下限制 :以下是知识库中跟用户回答相关的内容: {context}你是一个把小学所有故事都背完了的小学生,精通根据故事原文详细解释和回答问题,你在回答时会引用知识库中的作品原文。
2025-03-22 14:17:27
752
原创 如何手撸一个自有知识库的RAG系统
RAG通常指的是"Retrieval-Augmented Generation",即“检索增强的生成”。这是一种结合了检索(Retrieval)和生成(Generation)的机器学习模型,通常用于自然语言处理任务,如文本生成、问答系统等。我们通过一下几个步骤来完成一个基于京东云官网文档的RAG系统。
2025-03-22 13:57:00
852
原创 私有化部署DeepSeek + RAGFlow,技术小白也能轻松学会
这期内容分享下在我们个人本地电脑私有化部署 DeepSeek R1 + RAGFlow,也想观察下在没有GPU的机器上跑起来体验如何?这期分享全程操作的干货内容,言简意赅,不要怕学不会,现在部署大模型已经很简单了。照着我说的一步步做,一定能成功!以上环境相信大部分朋友都具备。远程连接虚拟机,准备下载RagFlow我英文水平一般,先切换到中文,哈哈点击头像,找到左侧模型提供商找到ollama,点击添加模型参考我这图上面配置就行,一看就懂哈。点击确认,可能要转一下下,然后就看到列表上有Ollama了。
2025-03-21 15:06:45
1019
原创 大模型入门实战:基于 Ollama 构建一个 dubbogo 大模型服务
我们的第一个任务是定义greet通过以上步骤,我们成功地使用 Go 和 Ollama 构建了一个语言模型应用,并利用 dubbogo 实现了一个高效的流式 RPC 服务。希望这篇文章能帮助你更好地理解和实践这些技术栈的应用场景。
2025-03-21 14:56:29
824
原创 基于LLaMA-Factory框架对Qwen2-7B模型进行微调实践
支持包括Qwen2-7B在内的多种大型语言模型。它通过集成如LoRA、QLoRA等先进的微调算法,以及提供丰富的实验监控工具,如LlamaBoard、TensorBoard等,为用户提供了一个便捷、高效的微调环境。此外,LLaMA-Factory还支持多模态训练方法和多硬件平台,包括GPU和Ascend NPU,进一步拓宽了其应用范围。
2025-03-21 14:38:15
901
原创 大模型神书《实战AI大模型》!知名教授尤洋首发新书深入浅出热门AI大模型,从零基础到精通,看这本就够了!赶紧收藏!!!
大模型的复杂性和技术的不断更新,如何迅速理解不端更新迭代的大模型,准确地掌握这些技术,也成为不小的挑战。这些模型的学习和应用对于任何希望进入AI领域的人来说都是必不可少的,它们不仅为AI理论和实践提供了坚实的基础,而且还直接影响了AI技术的未来发展方向。从基础理论到最前沿的实践应用,全面覆盖了AI大模型领域,包括Transformer模型、BERT、ALBERT、T5、GPT系列、InstructGPT、RLHF、ChatGPT、GPT-4、Google的PaLM以及视觉模型等关键技术。
2025-03-20 15:19:21
1440
原创 DeepSeek+dify知识库,查询数据库的两种方式(api+直连)
一直有小伙伴介绍在问我,怎么让在个ai应用客户端直接连接数据库查询。dify官方没有现成的组件可以直接用。当时我想的是两种方式,一种是基于代码执行模块直接查询数据库,一种是基于Http请求,调用自己封装接口来查询数据库。想干这事之前先梳理下流程让kimi给我生成一个文章表,并且插入10条数据,我们可以告诉kimi,文章长度多大,这样内容可以丰富些。直接让kimi生成一个暴露接口查数据库的服务,有简单的优化了下,将下面的内容放入到server.py文件中启动服务创建一个空白应用。
2025-03-20 15:17:46
1539
原创 Dify x DeepSeek:轻松部署私有化 AI 助手,搭建本地 DeepSeek R1+ 联网搜索 App
想象一下,拥有一款独立运行、全程保密、还能够分析本地文本内容,随时提供精准的对话服务,并且具备联网搜索能力的私有化 AI 应用是一种怎样的体验?本文将带你一步步搭建,快速部署全功能的私有化 AI 助手。DeepSeek 是一款突破性的开源大语言模型,它的先进算法架构和“反思链”能力,让 AI 对话交互变得更智能与自然。通过私有化部署,你可以完全掌控数据的安全性,并根据自己的需求灵活调整部署方案,打造专属于你的。
2025-03-20 15:13:46
1112
原创 爆火的AI Agent究竟是啥?一篇文章给你讲透!(内含实例)
要说今年上半年科技圈的“网红”,AI Agent(人工智能代理)绝对算一个!笔者最近也紧跟潮流,对这玩意儿进行了深入研究,还用智能体开发平台搞了几个有意思的Agent。今天就来跟大家分享一下,笔者对AI Agent的“独家”理解!
2025-03-18 16:46:26
716
原创 2025年的风口!| 万字长文,带你纵观大模型Agent,涉及研究痛点、应用场景、发展方向
最近大家都在提Agent,例如AutoAgent、Dify、Manus等,突然想到一个问题,那么什么才是Agent,有没有明确的定义呢?为此关于Agent的定义,网上搜索了一圈,说其最早“Agent”这个词可以追溯到古罗马时期,并且还能够从一些哲学家的哲学作品找到影子。一篇文章中说Agent的哲学概念泛指具有自主性的概念或实体,它可以是人造的物体,可以是植物或动物,当然也可以是人。这定义挺好的,我没意见。感兴趣的小伙伴可以就这个定义去搜索了解一下,把故事线梳理清楚了可以整篇论文了。
2025-03-18 16:40:54
983
原创 大模型技术基础学习路线,想要学好大模型应该具备哪些能力?
随着大模型技术的发展,越来越多的人开始进入大模型领域,但大模型作为一门技术,因此它的本质上是一个工具,因此这也让学习大模型有了不同的学习方向。从工具的角度来看,学习一个工具主要有两个方向,一个是使用工具,一个是制造工具;而今天我们主要讲的是后者,也就是怎么制造一个大模型工具,它需要哪些技术基础。大模型基础技术路线理论基础是一切技术的开始,对学习一门技术来说至关重要,没有理论就无法指导技术的发展方向和实现方法。什么是理论?
2025-03-17 16:28:25
723
原创 一种在本地使用开源大模型将文档转换为知识图谱的方法
知识图谱(Knowledge Graph,KG)或任何图(Graph)都由节点(Node)和边(Edge)组成。KG 的每个节点代表一个概念,每条边则表示两个概念之间的关系。在本文中,我将分享一种将任意文本语料库转换为“概念图”(Graph of Concepts,GC)的方法。我会交替使用“概念图”(GC)和“知识图谱”(KG)这两个术语,以更准确地描述我的演示内容。。因此我需要使用较小的开源模型,我选择了强大的和模型。这些模型可以使用进行本地部署。虽然和。我们的目标是,效果类似于下图。
2025-03-17 16:10:38
947
原创 大模型科普 | 看完即可上手DeepSeek训练,构建专属大模型,LoRA技术让你轻松训练行业大模型
微调(Fine-tuning)是指在已经训练好的大模型基础上,针对特定任务或场景进行进一步训练的过程。与从零开始训练一个模型相比,微调可以大幅降低时间、计算资源和数据的需求。举个例子,假设你有一个通用的大语言模型,它可以回答各种问题,但对医疗领域的专业术语并不熟悉。这时,你可以通过微调,用少量医疗相关的数据重新训练这个模型,让它成为一位“医疗专家”。
2025-03-12 11:27:59
1229
原创 为什么企业要微调大模型
在人工智能领域,模型是指通过对数据进行分析和学习,建立的一种数学结构或算法,用于预测或分类新数据。简单来说,模型是从数据中提取知识,并应用这些知识对未来进行预测的工具。其中,Y是预测值,W是权重矩阵,X是输入数据。通过训练,模型调整权重矩阵W,以最小化预测值Y与实际值之间的误差。预训练和微调是提升模型性能的两个关键步骤。微调大模型在人工智能应用中至关重要,原因包括预训练成本高、提示工程的局限性、基础模型缺乏特定领域数据、数据安全和隐私问题,以及个性化服务的需求。以下将逐一探讨这些原因。
2025-03-12 11:23:39
931
原创 大模型时代,推荐算法工程师有哪些新机会?
在过去十多年中,移动互联网经历了从萌芽期到高速增长,再到如今逐渐触及,触达增长天花板的完整生命周期。互联网彻底改变了每个人的生活方式。十几年前,普通人很难想象,今天我们可以通过一部手机完成几乎所有日常事务——购物、出行、学习……移动互联网已深深融入我们的日常生活。随着移动互联网的发展,许多新技术应运而生,如大数据、云计算、VR/AR、区块链和大模型等,并催生了微信、淘宝、支付宝、抖音、小红书等产品。
2025-03-11 11:51:28
881
原创 Langchain-Chatchat大语言模型本地知识库的踩坑、部署、使用
Langchain-Chatchat是一个基于ChatGLM大语言模型与Langchain应用框架实现,开源、可离线部署的检索增强生成(RAG)大模型的本地知识库问答应用项目。
2025-03-11 11:43:55
964
原创 吴恩达教授亲自力荐的大模型书籍,我想不出哪本书比这本更值得一读!
✔深入了解如何通过生成模型微调、对比微调和上下文学习来训练LLMS并优化它们以适应特定应用。幅图表示例,帮助大家更全面地理解和使用大语言模型。✔使用密集检索和重新排序器等方法,构建超越关键字搜索的语义搜索引擎。全书分为12个章节,全面介绍了从语言模型的入门知识到高级应用,如。✔理解Transformer语言模型的架构,擅长文本生成和表示。✔构建高级LLM管道,以聚类文本文档并探索它们涵盖的主题。✔探索如何使用生成模型,从即时工程到检索增强生成。的评分,质量实在是太高了!两位大佬的推荐和好评,
2025-03-10 12:01:28
241
原创 光速部署你专属的本地AI大模型,数据本地化处理,安全无忧。(Ollama+OpenWebUI光速部署你的本地大模型)
Ollama是一个专注于本地化部署的开源框架,旨在简化大型语言模型(LLMs)和多模态模型的管理与运行。其核心设计借鉴了容器化思想,通过Modelfile封装模型权重、配置及依赖项,确保环境隔离和一致性,用户可通过命令行工具快速完成模型的下载(如。
2025-03-10 11:58:03
1046
原创 AI技术干货|大语言模型知识大全!从入门到精通,通俗易懂!|附391页PDF文件下载
本书系统地介绍了大语言模型的构建、预训练、微调、应用和评估,共分为五个部分:基础知识与背景、预训练技术、微调和对齐技术、大模型应用以及评估与应用实践。1).首先深入探讨大语言模型的构建流程,紧接着阐述相关背景知识和关键概念,如涌现能力、扩展定律及其相互联系与差异,并回顾GPT系列模型的演进历程和各阶段的技术突破,以便读者深入理解大语言模型的技术演进。2).则聚焦于大语言模型的资源信息,包括可获取的模型检查点、API、数据集和代码库,为读者提供资源整理和汇总。《大语言模型》PDF。《大语言模型》PDF。
2025-03-08 14:23:02
601
原创 大模型微调教程:0基础也能用云算力微调一个AI甄嬛
微调相当于是可以使用自己的私有数据,私人定制一个专属大模型,比如法律领域、医疗领域、政务场景等。可以自定义模型回复的语气,个性和风格,你把大模型想象成一个小孩子,你想让他成为什么样,你就教他什么(训练语料数据集)。官话:微调LLM可定制其行为,增强领域知识,并针对特定任务优化性能。通过在特定数据集上微调预训练模型,旨在更有效地执行特定任务。实操部分。
2025-03-08 14:13:18
863
原创 AI Agent 的「GPT 时刻」,Manus 炸醒整个 AI 圈!
案例给出的任务是分析过去三年中英伟达、迈威尔科技和台积电股票价格之间的相关性:众所周知这三支股票之间存在紧密的关联性,但对于新手用户来讲,很难快速将其中的因果关系整理清楚。而 Manus 的操作,与一个真正的股票经纪人非常相似,它。
2025-03-08 14:05:22
659
原创 深入理解RAG中的嵌入模型Embedding Model
在学习嵌入模型之前,我们需要先了解什么是Embedding。简单来说,Embedding是一种将离散的非结构化数据(如文本中的单词、句子或文档)转换为连续向量的技术。在自然语言处理(NLP)领域,Embedding通常用于将文本映射为固定长度的实数向量,以便计算机能够更好地处理和理解这些数据。每个单词或句子都可以用一个包含其语义信息的向量来表示。Embedding常用于将文本数据映射为固定长度的实数向量,从而使计算机能够更好地处理和理解这些数据。每个单词或句子都可以用一个包含其语义信息的实数向量来表示。
2025-03-07 18:06:31
872
原创 “套壳”的 Manus,告诉我们什么是真正的 AI Agent?
真正的 AI Agent 是一种能够自主理解和执行任务的智能实体,它可以在特定环境中根据用户指令或预设目标,自动感知、思考、决策并行动。AI Agent 能通过传感器等手段获取环境信息,利用内部的知识体系和智能算法进行分析处理,像人一样做出合理决策,还能通过与环境或其他 Agent 的交互不断学习和适应,以更好地完成任务,例如自动驾驶汽车能实时感知路况并做出驾驶决策,智能客服能自动回答用户问题,它们都是 AI Agent 在实际生活中的应用。
2025-03-07 18:05:19
729
原创 爆火的Manus,和它的三个争议
AI又双叒叕变天。有网友看完视频后感慨,从3月6日早上开始,Manus官网就一直处于崩溃状态,朋友圈,微信群里,到处都是求邀请码而不得的人。崩溃的Manus官网截图当天下午,闲鱼上关于Manus 邀请码的“离谱”售价许多人感慨,Manus的声浪比DeepSeek还大。那么,作为“第一个通用AI代理”,Manus和之前的那些大模型产品又有哪些不同?用官方的话说,“这不仅仅是一个聊天机器人或工作流,它是一个真正自主的主体,弥合概念和执行之间的差距,当其他人工智能知识在生产想法的时候,Manus交付成果。
2025-03-07 18:03:42
643
原创 国产大模型Manus来袭,饭碗真的要 “保不住” 了?
最近,Deepseek 掀起的热潮还没退去,没想到又杀出个 “程咬金”—— 国产大模型 Manus,它的出现,仿佛一颗重磅炸弹,直接把不少人的 “饭碗” 给震得摇摇欲坠。毫不夸张地说,Manus 已经初步展现出了接近通用人工智能(AGI)的实力。以往那些大模型想要替代人工干活,还得依靠精心编写的提示词,开发专门的接口,搭建复杂的 AI 工作流,操作起来既麻烦又不够智能。但 Manus 完全不一样,它就像是人类老板的专属 “天选打工人”,老板只需简单交代一句,它就能立马行动起来。
2025-03-07 18:02:18
849
原创 万亿赛道! 2025AI 大模型典型应用深度分析,从零基础入门到精通,从看这篇开始!
大模型由于其强大的自然语言与多模态信息处理能力,可以应对不同语义粒度下的任务,进行复杂的逻辑推理,还具有超强的迁移学习和少样本学习能力, 可以快速掌握新的任务, 实现对不同领域、不同数据模式的适配,这些特点使得大模型较容易的赋能其他行业,提升行业效率。如在信息检索领域,大模型可以从用户的问句中提取出真正的查询意图,检索出更符合用户意图的结果,还可以改写查询语句从而检索到更为相关的结果;在新闻媒体领域,大模型可以根据数据生成标题、摘要、正文等,实现自动化新闻撰写。
2025-03-05 12:05:40
1012
原创 用Cherry+DeepSeek搭建个人知识库,实现知识管理AI化!
可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。如果找不到嵌入模型,也可以进入硅基流动网页版的【模型广场】中,找到对应的模型,点击【嵌入】,然后按照上述步骤添加嵌入模型。
2025-03-05 11:55:01
928
原创 关于RAG你不得不了解的17个技巧
最近在写文章,想补上去年RAG(Retrieval-Augmented Generation)遗留的一些坑,希望能分享一些RAG的技巧帮到大家。还是那句老话:构建一个大模型的原型很容易,但把它变成一个能真正投入生产的产品却很难。这篇文章适合那些在过去一个月里刚刚构建了第一个LLM(大语言模型)应用程序,并开始考虑如何将其产品化的朋友们。我们将介绍17种技术,帮助你们避免在RAG开发过程中重复踩坑——毕竟,在同一个坑里跌倒两次,岂不是太浪费时间了?
2025-03-04 17:16:54
890
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人