- 博客(540)
- 收藏
- 关注
原创 2025全网最全大模型全套学习教程,从提示词开始到智能体实战到部署本地模型一篇搞定!!!
如果你想成为AI大模型领域的顶尖人才,那么还需要通过不断地学习和积累经验,当你能够独立完成各种大模型项目的时候,你就已经成为金字塔尖的专家了。作为一名在互联网行业深耕十余年的技术人,我指导过许多同行和后辈,也深知在AI学习道路上,正确的资料与清晰的路径是何等重要。当前,一个不争的事实是:整个社会的生产效率因AI而提升,但具体到每个人身上,机遇并不均等。已准备就绪,它将是你学习路上最有力的加速器,也是你走向金字塔尖的起点。目标:具备训练、微调专属模型的能力,成为企业争抢的技术骨干。为此,我将一套完整的。
2025-10-11 19:37:44
462
原创 【值得收藏】基于LLM的智能简历匹配系统设计与实现详解
本文介绍基于大语言模型(LLM)的智能简历匹配系统设计与实现,针对传统简历筛选效率低、不智能、难以量化等痛点,提出结合向量检索与结构化信息匹配的创新方案。文章详解系统架构、简历解析、信息提取、多维度匹配评分等关键技术点,提供从自然语言交互到量化评估的完整实现路径。通过阅读本文,读者将掌握利用LLM构建智能招聘系统的全流程方法,提升招聘效率与精准度,为人力资源数字化转型提供实用技术参考。招聘流程中的简历筛选是核心环节。传统方法严重依赖人工,效率低下且容易遗漏。
2025-10-05 09:57:15
965
原创 【收藏必备】小白也能懂:文本召回与大模型RAG的向量检索技术入门
本文系统介绍了文本召回技术及大模型RAG的核心原理,对比分析了稀疏检索(TF-IDF、BM25)和稠密检索(BERT、GPT)两类模型的特点。稀疏检索擅长关键词匹配,稠密检索侧重语义理解,混合检索结合两者优势。文章还提供了一套完整的大模型AI学习路径,分为初阶应用、高阶应用、模型训练和商业闭环四个阶段,帮助读者从入门到精通掌握大模型技术,并附有免费学习资料获取方式。
2025-10-04 19:45:30
737
原创 大模型技术全解析:预训练、微调与提示学习,一篇收藏就够了
本文系统阐述了大语言模型核心技术,包括预训练策略、适配微调和提示学习三大关键方向。预训练方面,重点介绍了优化任务设计、热启动机制、分层渐进训练等高效策略;适配微调部分,深入解析了指令微调和参数高效学习方法;提示学习则详细比较了Prefix-Tuning、Prompt-Tuning和P-Tuning等技术的优劣。文章通过丰富的技术细节和实例分析,为开发者提供了从模型架构设计到参数优化的全流程指导,是掌握大语言模型开发的重要参考资料。
2025-10-04 15:50:58
647
原创 【珍藏】Mem0架构原理解析:构建大模型Agent记忆系统的关键技术点详解
Mem0的结构设计比较清晰,了解它的实现原理和结构设计对于长期记忆的了解学习非常重要,其中的实验策略以及一些最佳实践的数据也是在长期记忆事件过程中非常重要的输入和参考。但是个人从产品角度来讲,其中部分逻辑处理得比较简单,例如整个冲突机制,Mem0都是直接交给LLM进行处理,并没有考虑做产品化的处理;包括在整体记忆系统的设计广度也有所缺失,整个系统还是围绕核心的短期记忆到长期记忆的处理链路进行设计,并没有从一个完整的记忆系统角度进行设计,以及长期记忆系统在Agentic角度如何进行作用也没有更多探讨。
2025-08-29 16:11:22
1351
1
原创 大模型Agent实战宝典:信贷风控领域的要素融合与策略优化全解析(值得收藏)
在信贷风控领域下,以加工出具有“高效能”和“高可解释性”的策略为目标,其中:策略加工过程会涉及不同场景下的要素切分和融合,切分的阈值和融合的规则通常采用运筹算法在满足特定的约束条件下来求最优解,求最优解的过程需要人工不断地去重跑运筹算法,并“人肉串联”从切分到融合整个流程。策略加工后随着时间推移,策略会面临要素迭代滞后、性能衰退等问题,从而缺乏系统性优化机制。
2025-08-29 15:31:52
922
原创 Coze入门教程:用coze手搓agent智能体,让你的agent高质量的处理复杂任务!
Coze是一个强大的智能创作助手,能够根据用户需求自动生成高质量内容。以下为入门教程的核心要点
2025-08-19 15:28:11
1807
原创 大模型常用微调方法总结:P-Tuning、Prefix Tuning、Adapter、LoRA等
最后总结一下,微调通过在大模型上进行针对性、细致化的调整,有效提升了模型的性能,使其在特定任务中表现的更加准确、高效。同时,微调增强了模型的泛化能力,让模型在面对新数据时仍能保持良好的效果,适应复杂多变的应用场景。更重要的是,微调推动了大模型相关技术的创新与发展,为人工智能领域带来了新的突破和机遇,具有广泛的应用前景和重要的战略意义。
2025-06-24 16:24:21
945
原创 零基础也能体验模型微调!魔塔+LLaMa Factory手把手教程
我们天天微调微调,微调到底是啥感觉?所以今天用魔塔+LLaMa Factory 体验微调一个模型文科生也能跑完,不用考虑你自己电脑的配置,云上的。微调完我们还会引入到本地直接对话。(我用的数据集较简单,你可以丰富数据集制造更好效果)走一下最基本的简化流程,之后不管是面试还是项目沟通中都可以大概心里有个数了。
2025-06-24 16:19:39
1362
原创 大模型好书安利| 2024年AI生成式营销产业研究蓝皮书,PFD无偿分享!
生成式AI正在开启营销的新纪元,它通过赋能生产工具,全面提升营销业务流程中的生产力,并重构营销组织生产关系。这一变革不仅限于传统广告和社交媒体营销,还扩展到了电商运营、客户运营和产品创新等新兴领域。
2025-06-20 19:45:56
296
原创 如何转型AI大模型?我来讲讲我是如何成功转行进入AI大模型领域的,看完你就懂了!
随着人工智能技术的飞速发展,大模型领域逐渐成为职场新宠。作者从城市设计师转型为大模型行业从业者,分享了他在转行过程中的心路历程和宝贵经验,为有意踏入大模型赛道的朋友们提供了一份“避坑指南”。
2025-06-20 19:43:56
1079
原创 大模型详解万字长文!大模型(LLM)推理优化技术总结(非常详细,建议收藏)
大模型训练成本很高,且在推理过程中需要大量的计算资源,为了能够实现大模型应用落地,需解决大模型推理成本、模型响应速度等问题,这就需要对大模型进行推理优化。为此,本文将详细介绍主流的大模型推理优化技术,文章安排如下:
2025-06-20 19:36:20
1216
原创 LLaMA Factory 微调教程:如何构建高质量数据集?
一起来学习如何构建高质量的微调数据集。在开始学习之前,首先我们先补充演示一下,我们整体这次微调教程中,微调案例的一个最终效果。在本教程中,我们微调的基础模型是 Qwen2.5-7B-Instruct ,目标是微调后让其在特定场景下具备一定的推理能力,并且在 Web 安全领域具备专家级水准。
2025-06-12 19:58:44
835
原创 别只会用别人的模型了,自学Ai大模型,顺序千万不要搞反了!刚入门的小白必备!
在使用诸如DeepSeek、ChatGPT、豆包、文心一言等大模型之余,你是否知道这些大模型背后的技术原理是什么?假如让你从头开始学习大模型,你知道应该遵循什么样的路线嘛?今天给大家介绍一下Ai大模型的学习路线,顺序千万不要搞反了!,大家可以按照这个路线进行学习。
2025-06-12 19:53:58
838
原创 想转行AI行业?这篇文章告诉你我是如何“半路出家”转行算法工程师的!
算法岗是什么?算法岗,从根本内容上来说,是算法,算力,数据,应用场景的交集。从工作要求的角度来讲,是你的能力能够匹配大厂需要的工作要求。从个人角度来说,是你能够快速迭代和更新所需要的机器学习/深度学习知识+特定项目经历+比赛/相关paper+数据结构,并且能接受加班和kpi绩效化。当然相对来说,工资比较高,而且是未来5年的主航道。
2025-06-12 19:52:31
1162
原创 公司数据不泄露,DeepSeek R1本地化部署+web端访问+个人知识库搭建与使用,喂饭级实操教程,老旧笔记本竟跑出企业级AI
1 Ollama PC本地化部署1.1 下载Ollamahttps://ollama.com/目前Ollama支持macOS、Linux、Windows,选择相应的系统,macOS和Windows直接下载,Linux系统需要执行下面命令:curl -fsSL https://ollama.com/install.sh | sh
2025-06-04 15:55:53
910
原创 开口即图!我用Dify+数据库+Echarts搭建了一个能“听懂”人话的数据可视化助手!(含自然语言转SQL)
这次满足大家的需求,我将手把手带你利用dify的工作流编排能力和大型语言模型(LLM),搭建一个能“听懂”我们自然语言指令,自动查询数据库、判断图表类型,并最终生成酷炫Echarts图表的数据可视化助手!
2025-06-04 15:53:02
1663
1
原创 NLP实战 | BERT文本分类及其魔改(附代码)
本文主要介绍了两种文本分类模型:BERT文本分类基础模型,及基于Bert和TextCNN的魔改模型。在作者实际的有关文本分类的工作中取得了F1值超越Bert基础模型近4%的效果。
2025-06-03 17:27:48
752
原创 使用huggingface的Transformer库进行BERT文本分类代码
本文通过huggingface的Transform类进行BERT的文本分类代码训练与验证,数据集采用网上整理包括正向和负向评论的携程网数据,包括数据的加载、创建数据集、划分训练集和验证集、创建模型和优化器、包括训练与验证、模型的训练、模型的预测
2025-06-03 17:24:45
1155
原创 一书掌握Transformer!《从零到精通:手把手教你构建最先进的NLP模型》(文末附PDF下载)
ChatGPT红得发紫,强得让人类心悸。但在它的背后,还隐藏着一位真正的大佬。它的名字叫做——Transformer!在大数据和人工智能时代,机器学习 (Machine Learning,ML) 和 深 度 学 习 (DeepLeamning,DL) 已经成为各行各业解决问题的有效方法,自然语言处理 (Natural Language Processing,NLP) 是深度学习的重要应用领域之一。在过去的二十年中,自然语言处理经历了翻天 覆地的变化:从传统的自然语言处理方法 (n-gram 语言
2025-06-01 08:45:00
1542
原创 带你搞懂什么是BERT模型!就这一篇就够了!
BERT是一个预训练的语言表征模型。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练,而是采用新的masked language model(MLM),以致能生成深度的双向语言表征。BERT论文发表时提及在11个NLP(Natural Language Processing,自然语言处理)任务中获得了新的state-of-the-art的结果,令人目瞪口呆。
2025-05-30 22:15:18
1477
原创 图解 Transformer 与 MoE 的技术原理 !
Transformer模型自2017年提出以来,通过自注意力机制彻底改变了序列建模领域。它通过并行计算每个位置的语义关联,打破了传统循环神经网络(RNN)的速度瓶颈,成为机器翻译、文本生成等任务的标杆。然而,随着模型规模指数级增长,计算资源消耗与推理延迟问题日益凸显。这促使研究者探索更高效的架构,混合专家模型(MoE)应运而生。本文将从架构设计、工作原理、技术挑战三个维度,深入剖析Transformer与MoE的差异与演进逻辑。
2025-05-30 22:13:40
1164
原创 AI大模型 | 2024年AI生成式营销产业研究蓝皮书,附PDF免费下载
生成式AI正在开启营销的新纪元,它通过赋能生产工具,全面提升营销业务流程中的生产力,并重构营销组织生产关系。这一变革不仅限于传统广告和社交媒体营销,还扩展到了电商运营、客户运营和产品创新等新兴领域。
2025-05-29 16:36:09
740
原创 使用Ollama和Langchain动手开发AI搜索问答助手
本文主要介绍如何借助搜索引擎,获取比较新的内容,并对这部分内容的问题进行回答。首先会简单介绍原理,然后是环境准备,代码介绍,最后会通过Chainlit,构造一个完整的可视化Demo。
2025-05-29 16:35:04
613
原创 使用RAG技术构建企业级文档问答系统之QA抽取
从本文开始,将开一个大坑,陆续介绍企业级文档问答系统构建的全流程,以及关键环节的优化手段。重点介绍算法流程。构建一个基础版的RAG是非常简单的,甚至使用扣子、Dify等平台,熟练的情况下都用不了5分钟,即使使用Langchain、LlamaIndex等框架,搭建完整流程,代码也不会超过100行。但基础版的问答效果往往较差。
2025-05-29 16:31:16
957
原创 【大模型新书分享】掌握大语言模型:高级技术、应用、尖端方法和顶尖LLMs,附PDF
本书探讨了NLP的基础知识,如应用、演变、组件和语言模型。它教授数据预处理、神经网络和特定架构如RNNs、CNNs和变压器。它解决了训练挑战,介绍了如生成对抗网络(GANs)、元学习的高级技术,并引入了如GPT-3和BERT的顶级LLM模型。它还涵盖了提示工程。最后,它展示了LLM的应用,并强调了负责任的开发和部署。
2025-05-27 11:49:58
492
原创 Qwen3 本地部署指南:打造完全离线的AI助手
Qwen3 是阿里巴巴 Qwen 团队推出的最新开源大语言模型 (Large Language Model, LLM),它提供了令人印象深刻的性能,同时具备高度模块化和强大的工具调用能力。本指南面向程序员读者,将详细介绍如何在本地机器上部署 Qwen3,无需依赖任何云服务或 API 密钥。
2025-05-27 11:47:00
2157
原创 如何在离线的Linux服务器上部署 Ollama,并使用 Ollama 管理运行 Qwen 大模型
这样 Qwen2.5 就算导入成功了,实际上 llama 工具还可对大模型进行量化,量化后的大模型会更加精确,更加节省系统资源,有关量化的信息可自行研究.
2025-05-23 16:29:36
1413
1
原创 给大家推荐一本get新技能的书籍,人人都可动手做AI Agent基础入门!!!
可能还有很多小伙伴对这个概念很陌生,今天, 通过新书《动手做AI Agent》为大家科普一下它的来龙去脉。
2025-05-23 16:27:25
732
原创 零门槛上手!本地部署Ollama+OpenWebUI+Deepseek-R1操作指南
Ollama 和 Open WebUI 是两款非常实用的工具,可以帮助用户在本地轻松部署强大的语言模型和智能推理引擎。本篇文章将详细介绍如何零门槛地在本地部署 Ollama 和 Open WebUI,并通过 Deepseek-R1-14b 模型进行高效的推理。
2025-05-21 16:30:02
711
原创 行业大模型实战:基于千问+LangChain构建垂直领域大模型应用:电商场景实际案例
本文将以电商客服投诉信息的结构化处理为例,详细介绍如何基于LangChain框架和开源大语言模型构建垂直领域的智能应用。通过这一实例,我们将展示LangChain如何助力开发者快速构建、迭代和部署大模型应用,实现从非结构化文本到结构化数据的智能转换。
2025-05-21 16:28:11
945
原创 大模型入门书籍 | 《大模型基础》开源分享!附完整版PDF,无偿获取~
由浙江大学DAILY实验室毛玉仁研究员、高云君教授领衔撰写的《大模型基础》教材第一版。这本教材为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。
2025-05-13 15:09:33
549
原创 【大模型图解】「1 行 LangChain 代码」竟让 10 万份合同 3 分钟审完?
掌握了LangChain,就能用极少的代码完成原本需要团队数天才能做完的工作。香!这工具不整起来,纯属浪费生产力啊!
2025-05-13 14:46:13
862
原创 图解 LangChain 多语言文档处理,通宵达旦只为你打破语言障碍
图解 LangChain 多语言文档处理,通宵达旦只为你打破语言障碍LangChain 就像是一个多语言翻译官,可以帮你打通各种语言文档的沟通桥梁。2. 文本分割2. 语言检测与路由3. 多语言向量化2. 跨语言检索问答注意事项多语言模型比单语言模型体积更大,算力要求高不同语言分词逻辑差异大,记得调整分词器跨语言检索精度可能低于单语言系统评估时需为每种语言建立单独的测试集总结LangChain库是多语言文档处理的利器,可以帮你:掌握了LangChain多语言功能,从此告
2025-05-07 16:27:16
828
原创 一书掌握Transformer!《从零到精通:手把手教你构建最先进的NLP模型》(附PDF下载)
国内第1本Transformer——变形金刚红书如果一定要说未来谁能引领人工智能世界,是Transformer而非chatGPT!编辑推荐★★★★★ChatGPT红得发紫,强得让人类心悸。但在它的背后,还隐藏着一位真正的大佬。它的名字叫做——Transformer!
2025-05-05 15:35:03
786
原创 【图解】LangChain 带你零代码搭建智能客服,工单响应率翻番
2. 内存管理实用功能1. 知识库问答3. 多轮客服对话2. 智能回复生成LangChain 库是快速构建智能应用的强力工具,可以帮你:掌握了这些基础,就算没啥代码经验,也能拼拼搭搭做个智能客服出来。试试看,说不定你的客服响应效率真能翻几倍!大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “”“”等问题热议不断。不如成为,毕竟AI时代,谁先尝试,谁就能占得先机!想正式转到一些新兴的 AI 行业,不仅需要系统的学习AI大模型。同时也要跟已有的技能结合,辅助编程提效,
2025-04-28 18:01:15
1120
原创 【图解】只用 LangChain+SQL,我让老板的财务报表“自己”长出图表!
LangChain+SQL 就像是会魔法的会计师,可以把枯燥的财务数据变成生动的图表和分析报告。2. 自然语言查询2. 自动分析报告2. 异常监测与报警注意事项小心SQL注入,使用LangChain的安全机制,别直接拼SQL敏感数据要加密存储,别裸奔。数据库连接信息藏好点使用OpenAI API要限制token消耗,不然账单会吓死人异常监测建议结合人工复核,别全信AI的判断定期检查自动化流程是否正常,防止"自动故障"变"手动救火"总结LangChain+SQL库是连接自
2025-04-28 17:58:16
983
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅