自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(502)
  • 收藏
  • 关注

原创 全网跪求的AI圣经!浙大《大模型基础》PDF遭疯传,网友:比李沐还细!

这本浙大出品的大模型基础入门书籍:《大模型基础》你绝对不能错过!本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章,深入探讨了大模型的工作原理和使用方法-一提示工程,并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用,以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例,无论您是技术领域的专业人士,还是对新兴技术充满好奇心的读者,希望本书能激发您的思考,并为您展示一个崭新的创作世界。

2025-04-01 23:11:52 644

原创 使用 Ollama 本地模型与 Spring AI Alibaba 的强强结合,打造下一代 RAG 应用

Spring AI:Spring 生态的 Java AI 开发框架,提供统一 API 接入大模型、向量数据库等 AI 基础设施。Ollama:本地大模型运行引擎,大模型时代的 Docker,支持快速体验部署大模型。Spring AI Alibaba:Spring AI 增强,集成 DashScope 模型平台,快速构建大模型应用。Elasticsearch:向量数据库,存储文本向量化数据,支撑语义检索。数据加载与清洗:从外部知识库加载数据,向量化后存储到 Elasticsearch。

2025-04-01 21:50:21 745

原创 学大模型建议:大家有空可以多去GitHub学大模型❗—这个LLM知识库傻子都能看懂

🌟 大模型学习太难?别怕!这个仓库帮你从零基础到面试通关! 🌟无论你是技术小白还是求职达人,这里都有适合你的学习资料!从基础概念到高级应用,再到面试真题,一站式搞定大模型学习!💡

2025-04-01 18:21:32 188

原创 复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来

本文综述了基于大型语言模型(LLM)的智能体研究进展。LLM因其多功能性被视为通用人工智能(AGI)的潜在火花。文章追溯了智能体概念的起源,阐述了LLM作为智能体基础的优势,并提出了包含大脑、感知和行动的通用框架。同时,探讨了LLM智能体在单智能体、多智能体和人机协作等场景下的应用。最后,深入研究了智能体社会,讨论了其行为、人格和社会现象,并指出了该领域的关键问题和未来方向。

2025-03-28 23:20:07 758

原创 首发!59页 |《2025私域大模型部署白皮书》,人人必备的大模型部署白皮书!(附PDF)

今天给大家推荐一本超实用的专有领域大模型部署白皮书-《2025年私域部署大模型白皮书》,它以"开箱即用"的极致体验破解 AI 落地 " 最后一公里 " 的痛点。这本白皮书让AI大模型不再是科幻片里的幻想,而是实实在在改变企业运营的神器。企业对智能化转型的需求越来越迫切,私域大模型凭借其强大的通用性和泛化能力,成为企业智能化转型的重要基石。数据安全与隐私保护是重中之重,私有化部署成为确保数据安全的必然选择。 部署流程涵盖需求分析、数据治理、模型选型、系统部署、测试验证与持续运营等环节,每一步都至关重要。应用场

2025-03-28 18:47:23 165

原创 打造个人AI大模型:本地电脑部署全攻略_本地部署ai大模型

现在的ai很多,让我看得有些眼花缭乱,随着ai的发展,现在已经有很多ai的大模型已经支持开源,所以现在支持部署一个大模型在自己电脑上,数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受。

2025-03-27 23:23:05 420

原创 2025神仙级AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始!_ai新手入门教程

大模型的学习不仅能够提升你的技术能力,还能够帮助你更好地理解数据科学和人工智能的原理。随着大模型在各个行业的应用越来越广泛,掌握这一技术将为你提供更多的职业机会。从科学研究到商业应用,从金融服务到医疗保健,大模型正在成为推动创新和效率提升的关键因素。学习大模型不仅是因为它们在当今和未来的技术领域中占据重要地位,更是因为它们有能力解决复杂问题并创造新的可能性。

2025-03-27 23:21:32 939

原创 体验实在Agent,这才是当前形成生产力的企业级通用智能体

首先,要有专属的企业知识库。企业在生产经营中积累了大量文档和数据,这些是企业独有的宝贵资产,也是员工真正需要的知识。通用大模型无法涵盖这些内容,因此企业需要沉淀自己的知识库并具备数据分析能力,以实现落地应用。其次,要有专属的业务系统操作指南。经过30多年的信息化建设,企业内部已有多套系统,每套系统都有独特的业务特性和操作流程。智能体要实现自动化业务办理,必须理解这些系统的操作规范,根据企业的业务流程来指导其操作。第三,要支持模型的接入。大模型能力不断进化,企业需要根据自身业务特性选择并接入适合的大模型。

2025-03-25 14:36:58 951

原创 【重磅发布】中科院发布了DeepSeek满血版全参数微调指南,本地化部署和微调的权威参考来了!

💡 超强调参指南推荐!在大模型应用快速发展的背景下,如何高效地进行本地化部署,让企业和研究机构能够在自有算力环境中稳定运行和微调大模型,成为当前的技术挑战。DeepSeek-V3/R1 671B 满血版的全参数微调方案,正是针对这一痛点,由中国科学院自动化研究所与中科闻歌联合推出的一份 完整的开源指南(DeepSeek-671B-SFT-Guide),涵盖从训练到推理的完整代码与脚本,为有本地化部署需求的团队提供了从训练到推理的全流程方案,总结了关键的优化策略和实践经验!

2025-03-25 14:32:44 337

原创 智能客服搭建实战篇

下面以一个企业数字化服务的咨询公司的智能客服为例,介绍To B智能客服如何搭建。广义上来说,To C企业的智能客服应用更广,尤其是在售前咨询和售后争议解决方面,在数量级、AI场景丰富程度、SOP流程上都有更广的空间,但由于过往经验的限制(主要是知识库数据隐私限制),目前仅以To B企业数字化服务的咨询公司的智能客服来举例说明。

2025-03-22 17:52:25 826

原创 Java程序员转型大模型应用开发:掌握这12步就够了!

一、明确核心定位:发挥Java的工程化优势1. 专注大模型能力封装与集成Java程序员的核心竞争力在于企业级系统架构能力。应重点将大模型作为“工具”嵌入现有业务系统,例如:

2025-03-22 17:49:51 1275

原创 RAG知识库智能问答系统搭建(已脱敏)-基于大模型的知识库与知识图谱问答系统

基于大模型 RAG 知识库的知识图谱问答系统。大模型适配 OpenAI、国内主流大模型平台的模型调用、本地 vllm 部署。支持推理模型DeepSeek-R1、联网检索。🤖 多模型支持:适配 OpenAI、各大国内主流大模型平台,以及本地 vllm 部署📚 灵活知识库:支持 PDF、TXT、MD 等多种格式文档🕸️ 知识图谱集成:基于 Neo4j 的知识图谱问答能力🚀 简单配置:只需配置对应服务平台的 API_KEY 即可使用。

2025-03-22 10:33:54 556

原创 熬了几个夜,终于让Agentic RAG工作流正常运行了,特来分享一下

***一直以来都在想用 LLM + Agent + RAG + FastAPI 搭建一套完整的智能检索增强生成工作流(Agentic RAG Workflow)。我选择了一个客服支持项目来学习,经过一段时间的学习(主要是踩坑),大致上是跑通了这个工作流。赶紧总结分享起来。Agentic RAG(代理型 RAG) 只是与 AI 智能体架构一起使用的 RAG(检索增强生成)。使用传统 RAG 和 Agentic RAG,我们都可以使用 RAG Pipeline 填充搜索索引。

2025-03-22 10:21:52 887

原创 2025年AI 时代,程序员的出路在何方?

现在的 AI 大致是汽车的自动挡或者辅助驾驶阶段,更多的作为一个提效助手。不要抱怨 AI 的不完美,正是 AI 的不完美,我们不那么容易被淘汰。在大家都用大模型的情况下,多去发现更多应用场景,多去掌握提示词技巧,发挥大模型的价值,在 AI 逐渐普及的今天,多去培养和加强人相对于 AI 更有价值的能力,持续学习,才能在这个时代获取更多的优势。你认为 AI 时代,我们如何抓住这个风口?我们还需要增强哪些能力?

2025-03-21 10:39:58 543

原创 【RAG技术实战】-- 18种RAG技术测评(part1-11种方法对比)

首发Tableau这几天一直想做一个工作测试所有rag的效果,但是鉴于不同框架实现可能导致效果评测有差异。这两天偶然发现一个满自身项目研究分许的宝藏项目。作者从一个简单的RAG方法开始,然后测试更高级的技术,如CRAG、Fusion、HyDE等等!为了保持简单,作者没有使用LangChain或FAISS。而是只使用基础库以编写所有技术,以保持简单和易于学习,是非常不错的学习资料,这里简单学习整理,也记录下来分享给大家。代码库组织如下:对于,作者使用来测试一个小型LLM在RAG任务中的表现。对于。

2025-03-21 10:37:40 574

原创 书籍推荐:《从零构建大型语言模型》附免费PDF下载_从零构建大语言模型 pdf

通过从头开始**构建一个大型语言模型,了解如何创建、训练和调整大型语言模型 (LLMs)

2025-03-17 23:57:05 946

原创 LLM大模型基础入门:从头开始编写LLM代码

让我们回到多头注意力图。有了输入嵌入 X,我们可以开始实现多头注意力模块。实现多头注意力模块需要一系列步骤。让我们一一编码。

2025-03-17 23:54:48 606

原创 2025中国AI Agent行业研究报告|附43页文件下载

AI飞速发展的时代,Deepseek的出现更是加速了大模型能力进化,AI Agent在大模型能力升级的推动下实现从任务执行者(copilot)向决策主体的跨越,并能够通过传感器感知其所处的环境,根据其内部状态和预设的目标,通过执行器对环境进行影响,Manus的出现让中国AI Agent迎来自己的GPT时刻。中科视语的视语坤川智能体应用平台、卓世科技的璇玑玉衡大模型及AI家庭医生服务智能体、斑头雁的BetterYeah AI Agent开发平台在此背景下应运而生。

2025-03-14 22:42:58 696

原创 想转行进入 AI 领域,能通过哪些途径来实现?_ai行业怎么入行

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;这种项目最好是所有代码都开源的项目,这样你就能从头开始学习一个大模型的构建,大模型的。

2025-03-14 22:37:32 777

原创 2025年的风口!| 万字长文,带你纵观大模型Agent,涉及研究痛点、应用场景、发展方向

最近大家都在提Agent,例如AutoAgent、Dify、Manus等,突然想到一个问题,那么什么才是Agent,有没有明确的定义呢?为此关于Agent的定义,网上搜索了一圈,说其最早“Agent”这个词可以追溯到古罗马时期,并且还能够从一些哲学家的哲学作品找到影子。一篇文章中说Agent的哲学概念泛指具有自主性的概念或实体,它可以是人造的物体,可以是植物或动物,当然也可以是人。这定义挺好的,我没意见。感兴趣的小伙伴可以就这个定义去搜索了解一下,把故事线梳理清楚了可以整篇论文了。

2025-03-13 23:44:55 1012

原创 写给LLM新手的建议,让你少走2年弯路!

大模型的爆火,在全球范围内引发了一场A1“狂也在业界点燃了一场百模大战。结合蕞近飙”,两年我在大模型领域的一些经验,分享一下在校学生/新人如何转到大模型阵营。

2025-03-11 21:17:14 1609

原创 我花了30分钟,搭好一个本地能跑起来的大模型,飞机上都能用。

本文除了介绍安装大模型 phi-4 和 千问 2.5以外,还会详细介绍大模型本地部署的一些概念,适合感兴趣的朋友阅读,,完整阅读预计 10分钟。如果你只想看安装部分,可以跳着看哦~===

2025-03-11 21:14:11 679

原创 大模型好书推荐 -挖到宝了,500页RAG神书几乎把RAG讲得透透的

《基于大模型的RAG应用开发与优化——构建企业级LLM应用》 是一本专注于RAG(Retrieval-Augmented Generation,检索增强生成)技术应用的书籍。该书不仅为读者提供了全面深入的RAG技术知识,还注重实践性和可操作性,帮助读者快速掌握构建企业级LLM应用的能力。

2025-03-10 13:42:06 1161

原创 再看如何控制大模型思考时间?从S1预算控制到L1长度约束强化学习

本文主要回顾了推理大模型思考时间控制问题回顾,并看了几个工作,都值得一看,无论是使用prompt硬处理,还是使用强化微调,其实都依赖于大模型对数字是敏感的,这其实是不太可控的。并且,大模型推理性能是跟推理是看有关系的,控制之后,是否会带来损失,还需要具体业务问题具体分析。读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。

2025-03-10 10:40:01 1059

原创 推荐收藏!2025大模型算法工程师面试题来了(附答案)

2025年初deepseek横空出世,这也是预示着AI未来的发展方向。同时也将大模型技术推至无可争议的 C 位。基于大模型的研究与讨论,也让我们愈发接近这波技术浪潮的核心。最近大模型相关的招聘也非常多,小编整理了一些大模型面试常见问题,供大家参考。希望在找相关机会的同学能有好的收获。

2025-03-05 23:58:00 847

原创 大模型本地部署 | 详细教程,私有化部署体验 Dify!_dify和ollama区别

Dify是一个开源的 LLM 应用开发平台。其直观的界面结合了 AI 工作流、RAG 管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。AI大模型作为人工智能领域的重要技术突破,正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口,掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程,需要从基础开始,逐步深入到更高级的技术。

2025-03-05 15:08:12 807

原创 上海交大的大模型课已经next level!-《动手学大模型》实战教程+PPT分享!

今天就给大家分享一个交大的免费高质量课程。这个项目旨在提供大模型相关的入门编程参考每个部分都包括了详细的教程和参考资料,供学习者深入了解和实践。目前是2.2K星标,还是挺火的!

2025-03-03 11:21:34 296

原创 今年每个测试人都可以开发AI Agent(文末福利)

目前,AI应用还处于早期阶段。因此,作为Agent开发者,我们必须清楚地认识到这一点,对Agent过于理想化的想法,可能会给Agent的开发,或者Agent的应用推广带来困难和风险。早期的Agent开发平台提供的简易Agent,差不多就只是个性化的ChatBot,或者只达到了Copilot的水平,从严格意义上来讲不能称其为真正意义上的Agent。因此,Agent开发者一定要具有业务专家的思维,并提高理解业务能力和设计能力,从应用场景和业务分析视角规划和设计Agent,从而提高Agent解决问题的效果。

2025-03-03 11:11:03 656

原创 AI时代,普通人面对AI赚钱的机会在哪?这篇文章让你抓住AI风口!_ai时代信息差

发现很多伙伴对AI的认识几乎为零,可以说只知道AI很牛,但是不知道能用AI干嘛!另外很多伙伴,都是奔着利用AI赚钱的想法过来的,本身这没错但是要沉不下心学习一些AI知识,真心话,未必能搞到钱。

2025-03-02 01:05:21 1195

原创 2025大模型入门到进阶:什么是 RAG?为什么需要 RAG?RAG 的流程

RAG 全称 Retrieval-Augmented Generation,翻译成中文是检索增强生成。检索指的是检索外部知识库,增强生成指的是将检索到的知识送给大语言模型以此来优化大模型的生成结果,使得大模型在生成更精确、更贴合上下文答案的同时,也能有效减少产生误导性信息的可能。

2025-03-02 01:00:30 798

原创 2025年大模型应用落地白皮书:企业AI转型行动指南(74页附下载)

大模型技术正加速从探索走向企业落地,成为推动企业效率飞跃与业务创新的关键力量。当前,64%的中国企业预计未来三年对AI的投资将增长10%-30%,大模型在企业中的应用周期已缩短至6-12个月,尤其在数字化领先企业中落地更为迅速。企业正通过深化业务场景探索,积极寻找构建商业闭环的应用场景,以释放大模型的商业价值。大模型落地也面临多重挑战,包括算力成本高、模型选配难、部署细节复杂以及安全与可解释性问题。

2025-02-27 14:23:46 669

原创 手撕Transformer模型:分步骤数学实例解析

构建ChatGPT所依赖的数据集规模高达570GB。但是本文不用如此规模的data,所以我们将采用一个规模极小的数据集,通过可视化的手段直观地进行数值分析。虽然我们的数据集已经经过了清洗处理,但在实际场景中,比如创建像ChatGPT这样的模型时,清洗高达570GB的数据集是非常困难的任务,需要投入大量的时间和精力。

2025-02-27 14:01:57 620

原创 AI大模型从业者聊deepseek,附上给学弟学妹们的学习路径

DeepSeek对大模型行业的冲击:通俗解读最近,DeepSeek这个开源大模型火了!它就像一颗重磅炸弹,把大模型行业给“炸”了个底朝天。为啥呢?因为它不仅技术厉害,还特别“省钱”,让很多原本高不可攀的技术变得触手可及。咱们来聊聊它到底咋回事,以及对行业的影响。

2025-02-25 13:37:16 1059

原创 2025年值得关注的21个RAG开源项目

检索增强生成(RAG)框架通过将检索机制与生成模型相结合,彻底改变了大型语言模型(LLM)的使用方式。随着人工智能解决方案需求的不断上升,GitHub 上陆续出现了多个开源的 RAG 框架,每个框架都提供了独特的功能和特性。

2025-02-25 13:33:06 932

原创 99%的人都应该看看这本书,精简小册子让你快速跨入大模型的世界

最近在高铁上用4个小时读完了《大模型应用开发极简入门》,这本书是面向想要快速了解大模型(如GPT-4、ChatGPT)并直接开始应用开发的读者量身打造的。书中的内容通俗易懂、结构清晰,从基础概念到实际应用案例都有详尽讲解,非常适合初学者阅读。

2025-02-24 17:45:28 1066

原创 基于LLaMA-Factory框架对Qwen2-7B模型进行微调实践

在当前人工智能的发展中,大型语言模型(LLMs)已成为NLP研究和应用的关键。Qwen2-7B模型作为领域的领先者,以其巨大的参数量和强大的功能获得了广泛注意,尤其是它在经过微调后能更好地完成特定任务。本文旨在详述如何运用LLaMA-Factory框架高效微调Qwen2-7B模型,以优化其在特定任务中的表现。

2025-02-24 17:39:51 635

原创 年薪154W!2025真心建议大家冲一冲新兴领域,工资高前景好!

DeepSeek爆火,正在重塑AI圈!新开源模型DeepSeek-R1仅用OpenAI十分之一的成本,就达到顶尖大模型的性能,高性能低成本让企业接入AI成为必然趋势,到2030年AI人才缺口将有400万!稀缺也意味着高薪资。DeepSeek最近热招的大模型全栈工程师等,年薪高达154W!大模型实习生日薪也有500-1000元,直接拉高技术行业薪资标准!

2025-02-21 14:59:53 338

原创 Chain-of-Action (行动链):从Agent工作流到Agent模型

OpenAI的Deep Research功能推出后,开源社区出现了很多复现工作。比较有代表性的Hugging Face官方的Open DeepResearch,通过代码规划行动步骤,实现了思考(thought)和行动(action)交互的ReAct工作流。它同时支持后台接入系统一模型(如DeepSeek-V3)和系统二推理模型(如DeepSeek-R1)。

2025-02-21 14:46:23 881

原创 AI时代普通人如何翻身?这个领域让你赚到下一个十年!

随着人工智能(AI)技术的迅猛发展,大模型算是当之无愧最火的一个方向了。对于普通人来说。 这是一个绝佳的机会来提升自己的职业前景和经济状况。

2025-02-20 10:27:52 1588

原创 大模型实战教程之:本地部署,感受魅力

deepseek让笔者想起2011年的iphone4s:乔布斯开启了智能手机的移动互联时代,而梁文锋开启了"全民AI"的智能时代。可以说,2025年会是中国AI井喷的元年。身处AI的历史洪流当中,激动也好,彷徨也罢,我们都站在这伟大变革的前沿。基于此,笔者利用业余时间特编写了此大模型实战系列教程,带你一同感受AI的世界。第一章 本地部署,感受魅力本章将带你一起在本地PC上部署大语言模型(LLM,Large Language Model),实现与LLM的命令行和图形界面交互。一、硬件环境。

2025-02-20 09:58:01 821

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除