脱泥不tony-优快云博客

原创全网跪求的AI圣经！浙大《大模型基础》PDF遭疯传，网友：比李沐还细！

这本浙大出品的大模型基础入门书籍：《大模型基础》你绝对不能错过！本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章，深入探讨了大模型的工作原理和使用方法-一提示工程，并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用，以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例，无论您是技术领域的专业人士，还是对新兴技术充满好奇心的读者，希望本书能激发您的思考，并为您展示一个崭新的创作世界。

2025-04-01 23:11:52 644

原创使用 Ollama 本地模型与 Spring AI Alibaba 的强强结合，打造下一代 RAG 应用

Spring AI：Spring 生态的 Java AI 开发框架，提供统一 API 接入大模型、向量数据库等 AI 基础设施。Ollama：本地大模型运行引擎，大模型时代的 Docker，支持快速体验部署大模型。Spring AI Alibaba：Spring AI 增强，集成 DashScope 模型平台，快速构建大模型应用。Elasticsearch：向量数据库，存储文本向量化数据，支撑语义检索。数据加载与清洗：从外部知识库加载数据，向量化后存储到 Elasticsearch。

2025-04-01 21:50:21 745

原创学大模型建议：大家有空可以多去GitHub学大模型❗—这个LLM知识库傻子都能看懂

🌟 大模型学习太难？别怕！这个仓库帮你从零基础到面试通关！ 🌟无论你是技术小白还是求职达人，这里都有适合你的学习资料！从基础概念到高级应用，再到面试真题，一站式搞定大模型学习！💡

2025-04-01 18:21:32 188

原创复旦NLP团队发布80页大模型Agent综述，一文纵览AI智能体的现状与未来

本文综述了基于大型语言模型（LLM）的智能体研究进展。LLM因其多功能性被视为通用人工智能（AGI）的潜在火花。文章追溯了智能体概念的起源，阐述了LLM作为智能体基础的优势，并提出了包含大脑、感知和行动的通用框架。同时，探讨了LLM智能体在单智能体、多智能体和人机协作等场景下的应用。最后，深入研究了智能体社会，讨论了其行为、人格和社会现象，并指出了该领域的关键问题和未来方向。

2025-03-28 23:20:07 758

原创首发！59页 |《2025私域大模型部署白皮书》，人人必备的大模型部署白皮书！（附PDF）

今天给大家推荐一本超实用的专有领域大模型部署白皮书-《2025年私域部署大模型白皮书》，它以"开箱即用"的极致体验破解 AI 落地 " 最后一公里 " 的痛点。这本白皮书让AI大模型不再是科幻片里的幻想，而是实实在在改变企业运营的神器。企业对智能化转型的需求越来越迫切，私域大模型凭借其强大的通用性和泛化能力，成为企业智能化转型的重要基石。数据安全与隐私保护是重中之重，私有化部署成为确保数据安全的必然选择。部署流程涵盖需求分析、数据治理、模型选型、系统部署、测试验证与持续运营等环节，每一步都至关重要。应用场

2025-03-28 18:47:23 165

原创打造个人AI大模型：本地电脑部署全攻略_本地部署ai大模型

现在的ai很多，让我看得有些眼花缭乱，随着ai的发展，现在已经有很多ai的大模型已经支持开源，所以现在支持部署一个大模型在自己电脑上，数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受。

2025-03-27 23:23:05 420

原创 2025神仙级AI大模型入门教程(非常详细)，从零基础入门到精通，从看这篇开始！_ai新手入门教程

大模型的学习不仅能够提升你的技术能力，还能够帮助你更好地理解数据科学和人工智能的原理。随着大模型在各个行业的应用越来越广泛，掌握这一技术将为你提供更多的职业机会。从科学研究到商业应用，从金融服务到医疗保健，大模型正在成为推动创新和效率提升的关键因素。学习大模型不仅是因为它们在当今和未来的技术领域中占据重要地位，更是因为它们有能力解决复杂问题并创造新的可能性。

2025-03-27 23:21:32 939

原创体验实在Agent，这才是当前形成生产力的企业级通用智能体

首先，要有专属的企业知识库。企业在生产经营中积累了大量文档和数据，这些是企业独有的宝贵资产，也是员工真正需要的知识。通用大模型无法涵盖这些内容，因此企业需要沉淀自己的知识库并具备数据分析能力，以实现落地应用。其次，要有专属的业务系统操作指南。经过30多年的信息化建设，企业内部已有多套系统，每套系统都有独特的业务特性和操作流程。智能体要实现自动化业务办理，必须理解这些系统的操作规范，根据企业的业务流程来指导其操作。第三，要支持模型的接入。大模型能力不断进化，企业需要根据自身业务特性选择并接入适合的大模型。

2025-03-25 14:36:58 951

原创【重磅发布】中科院发布了DeepSeek满血版全参数微调指南，本地化部署和微调的权威参考来了！

💡 超强调参指南推荐！在大模型应用快速发展的背景下，如何高效地进行本地化部署，让企业和研究机构能够在自有算力环境中稳定运行和微调大模型，成为当前的技术挑战。DeepSeek-V3/R1 671B 满血版的全参数微调方案，正是针对这一痛点，由中国科学院自动化研究所与中科闻歌联合推出的一份完整的开源指南（DeepSeek-671B-SFT-Guide），涵盖从训练到推理的完整代码与脚本，为有本地化部署需求的团队提供了从训练到推理的全流程方案，总结了关键的优化策略和实践经验！

2025-03-25 14:32:44 337

原创智能客服搭建实战篇

下面以一个企业数字化服务的咨询公司的智能客服为例，介绍To B智能客服如何搭建。广义上来说，To C企业的智能客服应用更广，尤其是在售前咨询和售后争议解决方面，在数量级、AI场景丰富程度、SOP流程上都有更广的空间，但由于过往经验的限制（主要是知识库数据隐私限制），目前仅以To B企业数字化服务的咨询公司的智能客服来举例说明。

2025-03-22 17:52:25 826

原创 Java程序员转型大模型应用开发：掌握这12步就够了！

一、明确核心定位：发挥Java的工程化优势1. 专注大模型能力封装与集成Java程序员的核心竞争力在于企业级系统架构能力。应重点将大模型作为“工具”嵌入现有业务系统，例如：

2025-03-22 17:49:51 1275

原创 RAG知识库智能问答系统搭建（已脱敏）-基于大模型的知识库与知识图谱问答系统

基于大模型 RAG 知识库的知识图谱问答系统。大模型适配 OpenAI、国内主流大模型平台的模型调用、本地 vllm 部署。支持推理模型DeepSeek-R1、联网检索。🤖 多模型支持：适配 OpenAI、各大国内主流大模型平台，以及本地 vllm 部署📚 灵活知识库：支持 PDF、TXT、MD 等多种格式文档🕸️ 知识图谱集成：基于 Neo4j 的知识图谱问答能力🚀 简单配置：只需配置对应服务平台的 API_KEY 即可使用。

2025-03-22 10:33:54 556

原创熬了几个夜，终于让Agentic RAG工作流正常运行了，特来分享一下

***一直以来都在想用 LLM + Agent + RAG + FastAPI 搭建一套完整的智能检索增强生成工作流（Agentic RAG Workflow）。我选择了一个客服支持项目来学习，经过一段时间的学习（主要是踩坑），大致上是跑通了这个工作流。赶紧总结分享起来。Agentic RAG（代理型 RAG）只是与 AI 智能体架构一起使用的 RAG（检索增强生成）。使用传统 RAG 和 Agentic RAG，我们都可以使用 RAG Pipeline 填充搜索索引。

2025-03-22 10:21:52 887

原创 2025年AI 时代，程序员的出路在何方？

现在的 AI 大致是汽车的自动挡或者辅助驾驶阶段，更多的作为一个提效助手。不要抱怨 AI 的不完美，正是 AI 的不完美，我们不那么容易被淘汰。在大家都用大模型的情况下，多去发现更多应用场景，多去掌握提示词技巧，发挥大模型的价值，在 AI 逐渐普及的今天，多去培养和加强人相对于 AI 更有价值的能力，持续学习，才能在这个时代获取更多的优势。你认为 AI 时代，我们如何抓住这个风口？我们还需要增强哪些能力？

2025-03-21 10:39:58 543

原创【RAG技术实战】-- 18种RAG技术测评（part1-11种方法对比）

首发Tableau这几天一直想做一个工作测试所有rag的效果，但是鉴于不同框架实现可能导致效果评测有差异。这两天偶然发现一个满自身项目研究分许的宝藏项目。作者从一个简单的RAG方法开始，然后测试更高级的技术，如CRAG、Fusion、HyDE等等！为了保持简单，作者没有使用LangChain或FAISS。而是只使用基础库以编写所有技术，以保持简单和易于学习，是非常不错的学习资料，这里简单学习整理，也记录下来分享给大家。代码库组织如下：对于，作者使用来测试一个小型LLM在RAG任务中的表现。对于。

2025-03-21 10:37:40 574

原创书籍推荐：《从零构建大型语言模型》附免费PDF下载_从零构建大语言模型 pdf

通过从头开始**构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）

2025-03-17 23:57:05 946

原创 LLM大模型基础入门：从头开始编写LLM代码

让我们回到多头注意力图。有了输入嵌入 X，我们可以开始实现多头注意力模块。实现多头注意力模块需要一系列步骤。让我们一一编码。

2025-03-17 23:54:48 606

原创 2025中国AI Agent行业研究报告｜附43页文件下载

AI飞速发展的时代，Deepseek的出现更是加速了大模型能力进化，AI Agent在大模型能力升级的推动下实现从任务执行者（copilot）向决策主体的跨越，并能够通过传感器感知其所处的环境，根据其内部状态和预设的目标，通过执行器对环境进行影响，Manus的出现让中国AI Agent迎来自己的GPT时刻。中科视语的视语坤川智能体应用平台、卓世科技的璇玑玉衡大模型及AI家庭医生服务智能体、斑头雁的BetterYeah AI Agent开发平台在此背景下应运而生。

2025-03-14 22:42:58 696

原创想转行进入 AI 领域，能通过哪些途径来实现？_ai行业怎么入行

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；这种项目最好是所有代码都开源的项目，这样你就能从头开始学习一个大模型的构建，大模型的。

2025-03-14 22:37:32 777

原创 2025年的风口！| 万字长文，带你纵观大模型Agent，涉及研究痛点、应用场景、发展方向

最近大家都在提Agent，例如AutoAgent、Dify、Manus等，突然想到一个问题，那么什么才是Agent，有没有明确的定义呢？为此关于Agent的定义，网上搜索了一圈，说其最早“Agent”这个词可以追溯到古罗马时期，并且还能够从一些哲学家的哲学作品找到影子。一篇文章中说Agent的哲学概念泛指具有自主性的概念或实体，它可以是人造的物体，可以是植物或动物，当然也可以是人。这定义挺好的，我没意见。感兴趣的小伙伴可以就这个定义去搜索了解一下，把故事线梳理清楚了可以整篇论文了。

2025-03-13 23:44:55 1012

原创写给LLM新手的建议，让你少走2年弯路！

大模型的爆火，在全球范围内引发了一场A1“狂也在业界点燃了一场百模大战。结合蕞近飙”，两年我在大模型领域的一些经验，分享一下在校学生/新人如何转到大模型阵营。

2025-03-11 21:17:14 1609

原创我花了30分钟，搭好一个本地能跑起来的大模型，飞机上都能用。

本文除了介绍安装大模型 phi-4 和千问 2.5以外，还会详细介绍大模型本地部署的一些概念，适合感兴趣的朋友阅读，，完整阅读预计 10分钟。如果你只想看安装部分，可以跳着看哦~===

2025-03-11 21:14:11 679

原创大模型好书推荐 -挖到宝了，500页RAG神书几乎把RAG讲得透透的

《基于大模型的RAG应用开发与优化——构建企业级LLM应用》是一本专注于RAG（Retrieval-Augmented Generation，检索增强生成）技术应用的书籍。该书不仅为读者提供了全面深入的RAG技术知识，还注重实践性和可操作性，帮助读者快速掌握构建企业级LLM应用的能力。

2025-03-10 13:42:06 1161

原创再看如何控制大模型思考时间？从S1预算控制到L1长度约束强化学习

本文主要回顾了推理大模型思考时间控制问题回顾，并看了几个工作，都值得一看，无论是使用prompt硬处理，还是使用强化微调，其实都依赖于大模型对数字是敏感的，这其实是不太可控的。并且，大模型推理性能是跟推理是看有关系的，控制之后，是否会带来损失，还需要具体业务问题具体分析。读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用如果你是零基础小白，想快速入门大模型是可以考虑的。一方面是学习时间相对较短，学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2025-03-10 10:40:01 1059

原创推荐收藏！2025大模型算法工程师面试题来了（附答案）

2025年初deepseek横空出世，这也是预示着AI未来的发展方向。同时也将大模型技术推至无可争议的 C 位。基于大模型的研究与讨论，也让我们愈发接近这波技术浪潮的核心。最近大模型相关的招聘也非常多，小编整理了一些大模型面试常见问题，供大家参考。希望在找相关机会的同学能有好的收获。

2025-03-05 23:58:00 847

原创大模型本地部署 | 详细教程，私有化部署体验 Dify！_dify和ollama区别

Dify是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等，让您可以快速从原型到生产。AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。

2025-03-05 15:08:12 807

原创上海交大的大模型课已经next level！-《动手学大模型》实战教程+PPT分享！

今天就给大家分享一个交大的免费高质量课程。这个项目旨在提供大模型相关的入门编程参考每个部分都包括了详细的教程和参考资料，供学习者深入了解和实践。目前是2.2K星标，还是挺火的！

2025-03-03 11:21:34 296

原创今年每个测试人都可以开发AI Agent（文末福利）

目前，AI应用还处于早期阶段。因此，作为Agent开发者，我们必须清楚地认识到这一点，对Agent过于理想化的想法，可能会给Agent的开发，或者Agent的应用推广带来困难和风险。早期的Agent开发平台提供的简易Agent，差不多就只是个性化的ChatBot，或者只达到了Copilot的水平，从严格意义上来讲不能称其为真正意义上的Agent。因此，Agent开发者一定要具有业务专家的思维，并提高理解业务能力和设计能力，从应用场景和业务分析视角规划和设计Agent，从而提高Agent解决问题的效果。

2025-03-03 11:11:03 656

空空如也

空空如也