- 博客(535)
- 收藏
- 关注
原创 《2025 大模型平台落地实践研究报告》:AI大模型平台如何成为赋能千行百业的桥梁!(免费下载)
《大模型平台赋能行业智能化转型》摘要 大模型平台正成为AI产业化落地的关键载体,推动千行百业智能化升级。报告指出,百度、阿里等国内大模型在多模态融合、推理能力上取得突破,但企业应用仍面临场景模糊、算力成本高、运营机制缺失等挑战。大模型平台通过"建、用、管"全流程支持,构建模型开发、服务、应用三层核心能力,已在电商、金融、教育等领域实现显著成效:梦饷科技客服效率提升70%,考试宝试题解析成本降低90%。未来,随着多模态技术深化和生态协同,大模型平台将加速医疗、交通等领域的创新应用,开启智能
2025-06-13 15:39:38
1054
原创 大模型Dify案例分享-知识库检索整合Ragflow_dify+ragflow
今天给大家介绍一下关于dify和ragflow知识库整合案例,顺便给大家介绍一下ragflow。 话不多说,下面给大家演示一下效果。 我们首先看一下ragflow测试效果
2025-06-12 23:00:56
522
原创 2025最新AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始_ai教程
近年来,人工智能(AI)大模型的迅猛发展吸引了广泛关注,如GPT-3、BERT等。它们的强大能力在自然语言处理、图像识别等领域得到了广泛应用。如果你是AI领域的新手,想要从零基础开始学习并掌握神仙级AI大模型,本文将为你提供一份非常详细的入门教程
2025-06-12 22:58:32
1107
原创 OCR 识别质量如何影响 RAG 系统的性能?有何解决办法?
当我们谈论检索增强生成(RAG)系统的性能瓶颈时,大多数人会关注模型架构、向量数据库优化或检索、生成策略,但是否有人深入思考过一个更基础却被忽视的问题:光学字符识别(OCR)的质量究竟在多大程度上制约着整个 RAG 系统的表现?我们今天为大家带来的这篇文章,作者的观点是 OCR 的识别质量形成了一个隐形的性能天花板,从根本上限制了即使是最先进 RAG 系统的效果。
2025-06-10 13:21:34
780
原创 如何本地部署AI智能体平台,带你手搓一个AI Agent_ai平台搭建
搭建本地AI智能体平台指南 本文介绍了如何在个人电脑上部署开源LLM应用开发平台Dify,用于构建自定义AI智能体系统。Dify支持多模型编排、工作流设计、RAG管道等功能,可本地运行并对外提供API接口。 核心步骤: 安装Docker环境 克隆Dify源码并启动服务 通过本地网址配置账户 使用可视化界面管理模型和功能 该平台适合开发者快速构建AI应用,也支持非技术人员创建定制化智能体。通过模型协同工作可突破单一AI的局限,提升问题解决能力。文中包含详细部署教程和功能说明,帮助用户轻松上手这一前沿技术工具。
2025-05-28 23:21:38
847
原创 大模型时代开发者要学什么?怎么学?
大模型学习路径:从入门到实战的完整指南 本文系统梳理了大模型学习路线,包含五个阶段: 入门奠基(1-2月):掌握Python编程、数学基础和开发工具 知识夯实(2-3月):学习机器学习/深度学习基础和NLP技术 理论攻坚(1-2月):研究大模型架构与训练优化原理 实践进阶(2-3月):应用开源框架完成实际项目 前沿拓展(长期):追踪多模态等前沿技术 资料包包含640份行业报告、200本电子书、100集视频等资源,涵盖从系统设计到商业化落地的全流程。通过该路径,学习者可掌握大模型全栈开发能力,完成虚拟试衣系统
2025-05-28 23:19:13
920
原创 RAG(检索增强生成):提升大语言模型性能的终极指南
摘要 大语言模型(LLMs)面临时效性缺失、知识边界模糊和幻觉风险等局限,检索增强生成(RAG)技术通过动态检索外部知识库为其提供实时信息支持。RAG将检索与生成结合,适用于企业知识管理、智能客服升级和实时信息查询等场景。其技术流程包括数据预处理、检索、增强和生成四个步骤,依赖文档加载、向量化编码等技术工具。LangChain框架为RAG实现提供模块化支持,但RAG仍面临多模态数据处理、大规模数据性能瓶颈等挑战,需通过分层检索、近似算法等技术优化解决。
2025-05-27 09:18:38
638
原创 大模型面试看完这些,我直接进入字节了_字节大模型技术支持面试
本文分享了如何通过掌握大模型技术成功获得字节跳动等顶级科技公司offer的经验。文章包含大模型技术面试宝典,涵盖基础、进阶、微调、LangChain及参数高效微调等核心知识点,如主流开源模型体系、LLM架构、复读机问题、领域模型微调等。作者指出大模型技术是当前行业热点,掌握相关技能能显著提升求职竞争力,并提供了完整学习笔记和备考资料。对于AI大模型学习,建议从理论到实践系统掌握,结合具体应用场景深化理解,以应对技术面试挑战。
2025-05-27 09:15:11
791
原创 大模型微调(Fine-Tuning)全流程思考
大模型微调的过程:💡建议严格按照此流程来,不要跳步,不然可能会做无用功。 比如如果没有好好构建数据集,最后发现微调模型效果不佳是数据集的问题,就事倍功半了。
2025-05-24 10:18:04
912
原创 听劝!不要什么都不懂就开始学习大模型
前两天,一位朋友告诉我,她想转行成为一名AI工程师,于是向我请教了一些建议。我和她简要地聊了一下,发现她属于大模型的新手,于是我向她介绍了学习大模型的计划以及一些学习方法。🚲三个多月后,她告诉我,她找到了一份很不错的工作,实习期底薪为20k,转正后涨到30k以上,她兴奋不已
2025-05-24 10:14:14
1134
原创 从理论到实践:RAG、Agent、微调等6种常见的大模型定制策略
大语言模型(LLM)是基于自监督学习预训练的深度学习模型,训练数据量庞大、训练时间长,并且包含大量的参数。LLM在过去两年中彻底改变了自然语言处理领域,展现了在理解和生成类人文本方面的卓越能力。然而,这些通用模型的开箱即用性能并不总能满足特定的业务需求或领域要求。LLM单独使用时无法回答依赖于公司专有数据或封闭环境的问题,这使得它们在应用中显得相对通用。
2025-05-24 10:06:37
580
原创 一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI 的区别和联系
我们要把 AI 大模型当做人的大脑,因此调用 AI 大模型,相当于调用一个人,把 AI 大模型当人看,TA 懂人话、TA 说人话、TA 会直接给出结果,但结果不一定正确。因此在 AI 大模型的推理基础上,通过 RAG、Agent、知识库、向量数据库、知识图谱等技术手段实现了真正的 AGI(通用人工智能)。这些技术到底有哪些区别和联系,下图作了横向对比,接下来我们详细剖析下。
2025-05-24 09:58:59
729
原创 月薪已经炒到6W?强烈建议大家刷一下这个新领域!
曾几何时 ,企业不停优化35岁以上老程序员,只因IT技术更新迭代快,学习效率低,精力差,不能再熬夜加班写代码,因此出现了大量前端转前台,后端转后厨,python 卖肠粉等互联网行业热梗,其中不乏戏谑自嘲,更多透漏中年程序员心酸和无奈。
2025-05-24 09:55:19
587
原创 超简单使用A2A和MCP开发DeepSearch和AgentRAG(含源码)
在构建智能代理系统时,如何高效地集成上下文信息并实现代理之间的协同?本文将围绕 A2A (Agent2Agent) 协议和 MCP (Model Context Protocol),带你快速上手 DeepSearch 和 AgentRAG 示例,并讲解如何自定义开发基于 A2A 和 MCP 的工具。
2025-05-14 16:36:17
1006
原创 2025大模型必看书籍推荐:《AI赋能:企业智能化应用实践》企业级 AI智能化赋能应用,附PDF
AI赋能:企业智能化应用实践》是一本深入探讨人工智能技术在企业中应用的专业书籍。本书通过丰富的案例分析和实践经验详细阐述了AI如何助力企业实现智能化转型,提升运营效率和市场竞争力。
2025-05-14 16:31:13
1012
原创 探索RAG数据分块策略:工具对比与实践指南(含code)
在检索增强生成(Retrieval-Augmented Generation, RAG)应用领域,数据分块作为关键预处理步骤,对模型性能和效果起着决定性作用。本文深入探讨RAG应用中的数据分块策略,详细介绍和对比LangChain、LlamaIndex和Preprocess三种主流工具在数据分块方面的功能与特点,并结合实际案例分析其应用效果,为读者提供全面的技术指引。
2025-05-13 15:41:11
636
原创 复旦NLP团队2025新书《大规模语言模型:从理论到实践(第2版)》重磅来袭!
各位读者朋友们,相信你一定还记得,在各大平台AI大模型图书推荐榜单中,《大规模语言模型:从理论到实践》一书始终位居排行榜前列,在2023年末那个时间点,这本书是少有的把大模型相关技术系统汇总整理,既有理论又有实践的。时隔不到两年,大语言模型领域的发展可谓突飞猛进,大语言模型的能力在多个方面实现了显著突破,在推理能力、上下文理解深度及多模态处理能力等方面取得了长足进步。特别是在 2024 年 12 月,DeepSeek-V3的发布,以及 2025 年 1 月 DeepSeek-R1 的问世,更是引发了国内外的
2025-05-13 15:39:21
1015
原创 深度解析RAG技术在大模型时代的原理与实践
本文将结合Qcon的见闻,基于RAG的核心组件、RAG的常见范式,RAG的应用场景及RAG的评估,介绍当前各大公司使用RAG进行相应应用落地实践情况。
2025-05-09 14:17:39
807
原创 2025最新大模型面试题合集,大模型面试八股文
下是针对大模型(如GPT、LLaMA、PaLM等)技术面试的八股大纲,涵盖核心概念、原理、训练技巧、应用及优化方向等内容,帮助系统化准备面试:
2025-05-09 14:14:31
751
原创 检索增强生成(RAG):大模型落地的「智慧外脑」实践指南
在ChatGPT掀起的人工智能浪潮中,大语言模型(LLM)的问题始终是落地应用的痛点。检索增强生成(Retrieval-Augmented Generation,RAG)技术的出现,正在为这个难题提供突破性解决方案——它让大模型学会「查阅资料」,从此回答有据可依。总的来说,RAG是一种结合了信息检索和自然语言生成的方法,旨在处理自然语言处理任务中的信息检索和生成问题。在问答系统中,RAG可以利用外部知识库中的信息来支持生成更准确和全面的答案,特别是对于需要最新信息或广泛背景知识的问题。
2025-05-07 22:11:51
723
原创 狂揽 61K 星!优质开源AI项目-RAG框架/数据检索/Embedding分类
RAGFlow 是一款基于深度文档理解的开源检索增强生成(RAG)引擎。在你的应用程序中集成生成式人工智能的有主见的检索增强生成(RAG)🧠 专注于你的产品,而非检索增强生成技术。可轻松集成到现有产品中并进行定制!支持任何大语言模型:GPT4、Groq、Llama。支持任何向量数据库:PGVector、Faiss。支持任何文件。随你所愿。
2025-05-07 22:06:16
996
原创 浙江大学强势出品!《大模型基础》教材已开源!附PDF文档_大模型基础pdf
这本浙大出品的大模型基础入门书籍:《大模型基础》你绝对不能错过!本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章,深入探讨了大模型的工作原理和使用方法-一提示工程,并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用,以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例,无论您是技术领域的专业人士,还是对新兴技术充满好奇心的读者,希望本书能激发您的思考,并为您展示一个崭新的创作世界。
2025-05-07 22:00:49
569
原创 多模态模型痛点全解决!这两篇论文太硬核了
多模态大语言模型(MLLMs)是当前AI领域的重要研究方向,它通过整合文本、图像、音频等多种模态数据,显著提升了人机交互的自然性和应用广度。例如,在智能客服场景中,模型可同时解析用户的语音和文字信息以更精准地理解需求;在内容创作领域,则能基于图片自动生成匹配的文案。然而,该技术的发展仍面临若干关键挑战:**高质量多模态数据稀缺且标注成本高昂,导致训练样本不足;模型存在生成内容与事实不符的"幻觉"问题;多模态信息融合效率有待提升。**这些因素共同制约着模型的性能和实际应用效果。
2025-04-24 14:55:33
961
原创 99%的人都应该看看这本书-《多模态大模型算法、应用与微调》,看完你就是LLM大师!
详细介绍了先进的深度学习模型,包括Transformer、GPT系列、深度生成模型,从基本架构、训练方法到特定应用,包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器、GAN、ViT、CLIP、Stable Diffusion、各模型训练实践的知识点。此外,探讨了预训练模型的涌现能力、模型参数和通信数据量的估算,以及分布式训练的各种技术,如数据并行、模型并行和混合精度训练等。
2025-04-24 14:49:31
946
原创 2025,我(普通人)学习大模型的方法和步骤
自从今年年初DeepSeek火了之后,每个公司估计都或多或少的准备了解和积累大模型知识了。我们公司也不例外,领导安排大家每天都要花一小时来学习大模型,每周大家聚在一起总结一次经验。一开始,我对大模型的认知,是停留在ChatGPT的使用上,只知道大模型可以对话聊天,像一个真人,感觉很神奇,但是不知道是怎么实现的。也听说过一些名词,比如神经网络、向量、卷积、权重之类的,也不敢和别人深聊,因为都不知道是什么意思,感觉是很深的数学知识和科学知识。
2025-04-23 22:50:59
1031
原创 初探大模型成功的关键,到底谁能做好大模型?_大模型数据
AI大模型需要大规模、高质量数据,而数据的高效处理方式是大模型成功的关键,因此为应用程序迅速提供数据的能力至关重要。随着AI应用场景日趋复杂化,我们需要了解数据访问模式并采取合适的解决方案。支付宝是全球最大的移动支付平台之一,服务13亿个人用户和8000万商户。为了给用户提供最佳体验,支付宝依靠机器学习模型来支持各种功能,如欺诈检测、风险评估和个性化推荐。然而,随着支付宝用户群和交易量的增长,公司开始在模型训练方面遭遇挑战。计算和存储性能之间的差异导致模型训练缓慢且效率低下。
2025-04-23 22:45:15
733
原创 年薪百万招兵买马,拼多多杀入大模型,时代变迁,大模型时代来临
拼多多已经成立了一个数十人的大模型团队,团队位于上海。大模型团队将探索大模型在拼多多客服、对话等场景下的应用,且会拓展至其旗下跨境电商平台TEMU智能客服、搜索、推荐等业务场景。目前,整个进程仍处于研发阶段。行业分析人士认为,拼多多的大模型将为其电商体系进行服务,包括在AI导购、商品图片智能生成等方面的应用。拼多多已经通过官网,以及其他招聘渠道,开始在大模型领域招兵买马,有关大模型职位的年薪百万不在少数,最高将近130万元。图注:拼多多官网和BOSS直聘上,大模型相关岗位的招聘截图。
2025-04-16 23:17:15
855
原创 漫画趣解:大模型预训练、后训练、微调
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用如果你是零基础小白,想快速入门大模型是可以考虑的。一方面是学习时间相对较短,学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓。
2025-04-16 23:06:28
927
原创 AI时代新机遇:为什么你应该学习大型模型应用开发?
人工智能大潮已来,不加入就可能被淘汰。就好像现在职场里谁不会用PPT和excel一样,基本上你见不到。你问任何一个人问他会不会用PPT,他都会说会用,只是说好还是不好。你除非说这个岗位跟电脑完全无关。但凡说能用上电脑的,基本上都会用excel和PPT,你不会用的基本上都被淘汰了,逻辑一样。人工智能虽有一些应用场景,好像跟普通人没关。如智能驾驶,人脸识别,好像跟普通人关系不太大,我们都是被动使用。但现在这大模型跟我们每个人都有关,它是一个强大提升工作效率工具。你不会用,将来就好像跟PPT和excel一样,
2025-04-11 22:42:56
940
原创 为什么 MCP + A2A 可能是自互联网以来软件领域的最大变革?
今天,软件构建方式发生了一些重要变化,而大多数人没有注意到。Google 宣布的 Agent-to-Agent(A2A)协议,不仅仅是 AI 架构的又一次小幅升级。这标志着一种变革的初步开始,这种变革可能会结束过去七十年软件设计的传统方式——从确定性编程转向能够自主发现、适应和协作的系统。这种变化并非凭空而来。它建立在另一个同样重要的进展基础上:模型上下文协议(MCP),这是一种新的 AI 系统理解和使用工具的方式。
2025-04-11 22:39:50
610
原创 大模型算法工程师经典面试题————为什么现在的主流大模型都是 decoder-only 架构?
本人是某双一流大学硕士生,也最近刚好准备参加 2024年秋招,在找大模型算法岗实习中,遇到了很多有意思的面试,所以将这些面试题记录下来,并分享给那些和我一样在为一份满意的offer努力着的小伙伴们!!!为什么现在的主流大模型都是 decoder-only 架构?相比encoder-decoder架构,只使用decoder有什么好处吗?
2025-04-08 18:18:23
720
原创 强化学习+ RAG:从基础到优化的完整实现
在本篇博客中,我们将通过使用我们自己的强化学习(RL)奖励系统来改进我们最简单的检索增强生成(RAG)模型的实现,从而将事实性查询的检索质量从53%提升到84%。我们将从头开始编写所有代码,包括强化学习算法,且不使用任何Python库。原文地址:https://levelup.gitconnected.com/maximizing-simple-rag-performance-using-rl-in-python-d4c14cbadf59。
2025-04-08 18:14:05
696
原创 全网跪求的AI圣经!浙大《大模型基础》PDF遭疯传,网友:比李沐还细!
这本浙大出品的大模型基础入门书籍:《大模型基础》你绝对不能错过!本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章,深入探讨了大模型的工作原理和使用方法-一提示工程,并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用,以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例,无论您是技术领域的专业人士,还是对新兴技术充满好奇心的读者,希望本书能激发您的思考,并为您展示一个崭新的创作世界。
2025-04-01 23:11:52
694
原创 使用 Ollama 本地模型与 Spring AI Alibaba 的强强结合,打造下一代 RAG 应用
Spring AI:Spring 生态的 Java AI 开发框架,提供统一 API 接入大模型、向量数据库等 AI 基础设施。Ollama:本地大模型运行引擎,大模型时代的 Docker,支持快速体验部署大模型。Spring AI Alibaba:Spring AI 增强,集成 DashScope 模型平台,快速构建大模型应用。Elasticsearch:向量数据库,存储文本向量化数据,支撑语义检索。数据加载与清洗:从外部知识库加载数据,向量化后存储到 Elasticsearch。
2025-04-01 21:50:21
891
原创 学大模型建议:大家有空可以多去GitHub学大模型❗—这个LLM知识库傻子都能看懂
🌟 大模型学习太难?别怕!这个仓库帮你从零基础到面试通关! 🌟无论你是技术小白还是求职达人,这里都有适合你的学习资料!从基础概念到高级应用,再到面试真题,一站式搞定大模型学习!💡
2025-04-01 18:21:32
222
原创 复旦NLP团队发布80页大模型Agent综述,一文纵览AI智能体的现状与未来
本文综述了基于大型语言模型(LLM)的智能体研究进展。LLM因其多功能性被视为通用人工智能(AGI)的潜在火花。文章追溯了智能体概念的起源,阐述了LLM作为智能体基础的优势,并提出了包含大脑、感知和行动的通用框架。同时,探讨了LLM智能体在单智能体、多智能体和人机协作等场景下的应用。最后,深入研究了智能体社会,讨论了其行为、人格和社会现象,并指出了该领域的关键问题和未来方向。
2025-03-28 23:20:07
847
原创 首发!59页 |《2025私域大模型部署白皮书》,人人必备的大模型部署白皮书!(附PDF)
今天给大家推荐一本超实用的专有领域大模型部署白皮书-《2025年私域部署大模型白皮书》,它以"开箱即用"的极致体验破解 AI 落地 " 最后一公里 " 的痛点。这本白皮书让AI大模型不再是科幻片里的幻想,而是实实在在改变企业运营的神器。企业对智能化转型的需求越来越迫切,私域大模型凭借其强大的通用性和泛化能力,成为企业智能化转型的重要基石。数据安全与隐私保护是重中之重,私有化部署成为确保数据安全的必然选择。 部署流程涵盖需求分析、数据治理、模型选型、系统部署、测试验证与持续运营等环节,每一步都至关重要。应用场
2025-03-28 18:47:23
227
原创 打造个人AI大模型:本地电脑部署全攻略_本地部署ai大模型
现在的ai很多,让我看得有些眼花缭乱,随着ai的发展,现在已经有很多ai的大模型已经支持开源,所以现在支持部署一个大模型在自己电脑上,数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受。
2025-03-27 23:23:05
564
原创 2025神仙级AI大模型入门教程(非常详细),从零基础入门到精通,从看这篇开始!_ai新手入门教程
大模型的学习不仅能够提升你的技术能力,还能够帮助你更好地理解数据科学和人工智能的原理。随着大模型在各个行业的应用越来越广泛,掌握这一技术将为你提供更多的职业机会。从科学研究到商业应用,从金融服务到医疗保健,大模型正在成为推动创新和效率提升的关键因素。学习大模型不仅是因为它们在当今和未来的技术领域中占据重要地位,更是因为它们有能力解决复杂问题并创造新的可能性。
2025-03-27 23:21:32
1028
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人