- 博客(1757)
- 收藏
- 关注
原创 AI圈炸裂!智谱华章和Minimax即将港股上市,116VS165,程序员的好日子来了!
港股即将迎来国产大模型双雄上市。智谱华章将于1月8日以每股116.20港元发行3741.95万股H股;次日,Minimax将以每股165港元发行2538.922万股。两大AI巨头接连登陆港股,标志着国产大模型产业进入新阶段,或将引发AI技术新一轮创新浪潮。
2026-01-08 15:02:36
256
原创 震惊!大模型落地场景大洗牌:智能编程竟成‘潜力股‘,阿里云腾讯科大讯飞为何抢着布局?
2025年应用类大模型中标项目达4362个,占比58%。大模型落地五大场景为:智能审核&分析决策(521例)、智能客服&数字人(480例)、知识问答&知识平台(371例)、内容生成(119例)、智能编程(40例)。科大讯飞在大模型应用落地中领先,百度、火山引擎紧随其后。智能体项目快速增长,2026年厂商比拼重点将是大模型能否真正交付业务价值。
2026-01-08 15:02:04
378
原创 某单位工作人员处理内部文件,违规使用AI大模型,导致敏感资料被境外IP非法访问和下载
国家安全部近日披露案例,个别单位因直接使用开源框架建立联网大模型,导致攻击者未经授权即可自由访问内部网络,从而引发数据泄露和安全风险。案例显示,某单位工作人员在处理内部文件时,违规使用开源AI工具,由于电脑系统默认开启公网访问且未设密码,导致敏感资料被境外IP非法访问和下载。何为“开源大模型”?有哪些安全隐患?刚才提到的开源框架大模型指的是什么?存在哪些安全隐患?我们来听专家的解读。
2026-01-08 15:01:28
155
原创 程序员狂喜!GLM-4.7表现如何?这4个榜单告诉你真相,选对模型效率翻倍!
文章介绍了四个大模型评测榜单:lmarena(人类对战评测)、Artificial Analysis(多维度评估)、SuperCLUE(专注中文模型)和llm-stats(综合对比)。这些榜单从不同角度评估大模型性能,特别是在编程开发等领域的表现,帮助开发者选型。但提醒用户榜单仅供参考,实际使用体验更重要。文章介绍了四个大模型评测榜单:lmarena(人类对战评测)、Artificial Analysis(多维度评估)、SuperCLUE(专注中文模型)和llm-stats(综合对比)。这些榜单从不同
2026-01-08 15:00:58
181
原创 什么是AI外呼Agent?头部企业有哪些
从全球发展格局来看,AI外呼Agent呈现“中国高覆盖、北美高渗透、欧盟高合规”的区域特征。中国以占全球38.6%的部署终端数和52.7%的亚太市场贡献率,展现出“高覆盖、强融合、广适配”的独特优势。未来,随着大模型技术的持续迭代与多模态交互技术的成熟,AI外呼Agent将向三个方向演进:一是更深度的拟人化交互,融合表情、动作等多模态信息,进一步提升沟通亲和力;二是更智能的自主决策能力,能够独立处理更复杂的业务流程,实现“端到端”的服务闭环;三是更严格的合规与伦理规范,在技术创新与用户权益保护之间实现平衡。
2026-01-08 15:00:26
251
原创 20260107_160906_Claude_Code_Skills:Agent_架构的第三
最近一年都在讨论 Agent。MCP、Subagent、多 Agent、工作流,一个比一个高级。但我想问你一个很简单的问题:当你说“我在用 Agent”的时候——你到底是在给 AI 工具,还是在让它真的学会一种能力?直到我认真看完 Claude Code Skills 的设计,我才意识到:我们很可能一直在把这几件事混着用。这篇文章,我想用最直观的比喻,把一件事讲清楚:Claude Code Skills,和 MCP、Subagent、工作流,到底解决的是不是同一类问题。
2026-01-07 16:19:43
508
原创 【AI开发指南】李开复最新演讲:别再卷C端了!B端AI开发才是程序员们的“真香“战场,附实战干货
李开复指出AI Agent最大的价值在B端领域。2026年C端AI战争已结束,大厂垄断明显;而B端企业愿意为能带来业务增长的AI解决方案付费。零一万物采用"一把手工程"模式,深度参与企业业务流程重塑。2026年将是"企业多智能体上岗元年",AI系统将重塑企业管理。中美大模型发展路径不同但都能赢,创业者应深耕B端蓝海或避开大厂C端红海,布局AI终端要快速迭代。
2026-01-07 16:19:08
532
原创 一行指令让AI变全能?揭秘Agent+MCP+Skill+Function Calling四大核心技术,小白程序员也能秒懂!
文章详解了让AI实现"自主干活"的四大核心技术:Agent负责自主决策与任务拆解;MCP作为万能适配器解决工具兼容性问题;Skill作为专业技能工具箱提供专业知识;Function Calling确保工具调用准确。这四大概念协同工作,构成完整智能链路,推动AI从聊天助手进化为能解决复杂业务问题的智能伙伴。
2026-01-07 16:18:16
209
原创 小白程序员福音!RTX 4090也能跑的32B大模型,手把手教你搭建RAG系统,告别AI幻觉!
本文详细介绍了通义开源的QwQ-32B中型推理模型,它虽只有320亿参数却性能出色,支持消费级显卡部署。针对该模型在长文本复杂推理上的不足,文章通过Ollama和Milvus构建RAG系统,解决幻觉问题。内容包括模型选型、环境准备、数据集处理、Embedding模型准备及完整RAG构建流程,为普通开发者提供本地化大模型应用方案。
2026-01-07 16:16:10
318
原创 不用验证器也能训练大模型?RLPR技术详解,小白也能上手的AI黑科技
本文深入解析了大模型强化学习从RLVR到RLPR的范式演进,揭示了1-shot RLVR的惊人数据效率和RLPR如何通过参考概率奖励突破验证器限制,实现通用领域训练。文章详解了GRPO、RLVR与RLPR三者关系,结合verl框架展示工程落地细节,并探讨了RL训练与模型蒸馏的协同应用,为大模型推理能力进化提供了全新技术路径。
2026-01-07 16:15:29
701
原创 大模型又“胡说八道“了?复合AI系统(CAIS)拯救你的项目,附完整代码实现
文章介绍了复合人工智能系统(CAIS)如何解决大模型幻觉和知识更新问题。从RAG到Agent架构的演变,通过集成多种AI技术和模块提升系统性能。文章详细讲解了使用Claude 3.5 Sonnet、LlamaIndex和Milvus构建Agentic RAG的完整流程,包括数据加载、环境配置、索引创建、查询引擎构建和AI Agent开发。CAIS架构提高了系统的灵活性、可扩展性和准确性,是解决大模型局限性的有效方案。
2026-01-07 16:13:13
582
原创 Anthropic 震惊发声:扔掉那些花哨工具!智能体终局竟然只要 Bash?大道至简!
Tariq 推崇的这套 Unix 哲学,推崇文件系统,推崇由代码生成来驱动业务逻辑。构建一个简单的 Agent 很容易,但构建一个简单且优雅的 Agent 架构很难。回到计算机科学的基础设施中去,让Agent像一个真的程序员一样工作,这可能才是 Agent 的终极形态。
2026-01-07 16:12:34
614
原创 当9000亿个AI智能体互联,程序员如何不被淘汰?四大通信技术你必须掌握
智能体(AI Agent)通信技术正推动网络从"人机交互"向"智能体互联"转型。文章分析智能体通信将带来节点数量增长10-100倍、流量提升60-600倍的量变,以及通信主体、组网架构、交互方式和通信范式的质变。未来需从"智-通-算"融合架构、动态组网技术、轻量化协议设计、身份安全认证四大方向突破,构建适应9000亿个智能体互联的新型网络体系,为程序员提供AI时代的技术发展新方向。
2026-01-07 16:08:08
508
原创 五分钟论文跟踪 | NBER2025 | AI智能体(agent)大热,能用科斯老人家的理论解释吗?
本文从经济学视角探讨了 AI 代理(能够代表人类委托人进行感知、推理和行动的自主系统)对数字市场的变革性影响。核心观点是,AI 代理通过显著降低,将重塑市场结构、供需关系和竞争动态。文章从需求、供给、市场均衡和未来市场设计等多个层面进行了分析。
2026-01-07 16:07:18
750
原创 哈啰大厂实战:从ES到Milvus再到Zilliz Cloud,小白也能懂的大模型RAG落地指南
哈啰集团构建全面AI布局,通过基于向量数据库的RAG技术提升业务效能。文章详解其技术选型历程:从ES的局限性发现,到Milvus的性能优势,最终选择Zilliz Cloud实现弹性扩容与高可用。该方案已成功应用于智能客服、内部提效平台、图像比对及数字人直播等场景,显著提升用户体验与业务效率,为行业数字化转型提供实践参考。
2026-01-07 16:06:32
594
原创 【AI黑科技】RAG检索增强生成,让大模型从“一本正经地胡说“到“引经据典“!
这篇文章详细介绍了RAG(检索增强生成)技术,包括其定义、架构、主要模块和实现方法。文章解释了为什么需要RAG(解决LLM的幻觉、时效性和数据安全问题),并详细介绍了RAG的五大模块:版面分析(处理多种文件格式)、知识库构建(文本分块、向量化、索引构建)、大模型微调、文档检索和Reranker技术。最后还推荐了几个实用的RAG开源项目如RAGFlow、QAnything等,为开发者提供了完整的RAG技术实践指南。
2026-01-06 17:27:20
302
原创 AI圈炸锅!GraphRAG让大模型不再“一本正经地胡说八道“,小白程序员也能上手的知识图谱增强技术!
GraphRAG是将知识图谱融入RAG系统的新方法,通过显式语义关系和图结构优势,有效解决传统RAG在关系理解、上下文完整性、检索噪音和推理能力等方面的局限。提供更精确上下文和更强推理能力,特别是在多跳和事实性要求高的场景表现出色,尽管面临知识图谱构建维护、性能和成本等挑战,仍是AI检索增强技术的重要发展方向。
2026-01-06 17:26:46
977
原创 智能体工程全指南:从概念到落地,深度复盘发展现状,收藏这一篇就够了!
Agent 工程化是将 LLM(大语言模型)驾驭为可靠系统的迭代过程。由于 Agent 具有非确定性,我们认为工程师需要快速迭代以提炼和提高 Agent 的质量。
2026-01-06 17:25:47
786
原创 【AI炸裂】别再死磕RAG了!我的“认知操作系统“让大模型智商翻倍,代码级解析
本文探讨了AI时代个人认知操作系统的构建,通过与三大AI模型的辩论,提出了KAI(知识AI)架构。区别于传统RAG存储静态信息,KAI存储"思维模型"作为"算法",通过"认知调度层"实现意图识别和专家团协作。最佳架构是三层混合模型:底层RAG存储事实,中层KAI存储方法论,顶层SOTA Model提供推理能力,打造永不停歇的"赛博专家团"。
2026-01-06 17:23:54
874
原创 震惊!清华大一作业就要求搭建RAG系统,30分钟带你掌握大模型检索增强生成技术,小白也能变大神!
本文详细介绍了RAG(检索增强生成)技术,包括其定义、三种演进范式(Naive RAG、Advanced RAG和Modular RAG)及完整工作流程。文章系统讲解了从知识分块、嵌入生成、向量存储到语义检索、重排序和增强生成的七个关键步骤,帮助开发者理解如何构建高效RAG系统,提升大模型回答准确性和减少幻觉,是入门RAG技术的实用指南。
2026-01-06 17:23:17
534
原创 震惊!多步RAG终于被“超图记忆“治好了!小白也能秒懂的大模型推理黑科技
多步检索增强生成(RAG)能解决大模型在复杂任务中的信息不足问题,但存在事实碎片化的痛点。最新研究提出的HGMem超图记忆机制,通过将检索到的信息组织为超图结构,自动捕捉事实间的高阶关联,使大模型能够进行更连贯、全局的推理,显著提升了多步RAG的性能,为RAG技术发展提供了新思路。
2026-01-06 17:22:40
1470
原创 yyds!LangGraph+RAG=AI开发神器,小白也能快速上手高级AI系统
本文详解如何使用LangGraph框架构建高级RAG工作流,结合检索与生成模型提升AI回答质量。文章介绍了LangGraph在流程编排、状态管理、工具集成方面的优势,提供了完整架构设计、实践案例和系统实现方法。通过模块化设计和条件分支机制,开发者可构建智能决策、高可维护性的RAG系统,适用于智能客服、内容创作等多种场景,大幅提升AI应用开发效率与质量。
2026-01-06 17:21:48
728
原创 【人工智能报告厅】2025 AI Agent(智能体)圣经:智能体颠覆行业终极指南(附下载方式)
本报告聚焦 AI Agent(智能体)行业,基于 CB Insights 的预测性情报,全面呈现了该领域的发展态势、核心趋势与未来展望。AI Agent 是以大语言模型(LLM)为基础,能通过推理、规划、利用记忆及与外部工具和其他智能体交互,自主为用户执行任务的系统。自 2023 年起,该领域发展迅猛,涌现出 500 多家初创企业,成为科技行业下一波创新浪潮的核心。
2026-01-06 17:15:09
1003
原创 【保姆级教程】医疗RAG开发全攻略:Milvus+Embedding模型+大模型,小白也能快速上手!
本文详解医疗RAG系统架构与实现,采用Milvus向量数据库+医疗Embedding模型+安全生成逻辑,涵盖基层诊断、用药预警、肿瘤治疗三大落地场景,提供完整技术选型建议,强调AI医疗是辅助决策而非替代医生,为开发者提供医疗AI实战指南。
2026-01-06 17:13:16
904
原创 大模型RAG架构深度解析:让AI不再“一本正经地胡说八道“,程序员必备技能!
本文详细介绍了RAG(检索增强生成)技术的架构与实现流程,包括数据准备阶段(提取、分割、向量化、入库)和应用阶段(检索、提示词工程、生成)。重点讲解了文本分割策略、向量化模型选择、数据检索方法和提示词工程等关键技术点,并强调了RAG的核心目标是"检索要准、上下文要真、模型要被约束"。RAG不是简单的"给大模型接数据库",而是一套完整的信息检索与生成协同系统。
2026-01-06 17:12:11
666
原创 【AI神器】一行代码搞定CAD图纸分析!多模态RAG系统保姆级教程,小白也能秒懂的AI开发实战
本文详细介绍了如何从零构建一个基于多模态RAG的CAD图纸智能问答系统。通过接入VLM模型解析技术图纸,提取结构化元数据并存入向量数据库,实现了直接问答和图像检索两种智能问答模式。该系统可应用于房地产销售、室内设计、智能选房和户型对比等场景,大幅提升了技术图纸管理查询效率。代码实现完整,包含环境配置、模型接入、向量存储和智能问答等核心环节。
2026-01-05 18:06:55
674
原创 从“删库跑路“到“稳坐钓鱼台“:Spring AI金融RAG安全架构全解析,小白也能秒会的五维权限控制!
文章讲述了金融行业RAG系统的安全与权限体系构建,提出"检索前过滤"的核心心法和"五维动态策略"(环境、角色、意图、知识、约束)。通过Spring AI与Spring Security结合,实现数据隐身、意图识别、动态脱敏等功能,并建立全链路审计机制。强调在金融领域,安全比AI的"聪明"更重要,这套架构能有效防止敏感信息泄露,确保系统合规稳定运行。
2026-01-05 18:06:13
535
原创 震惊!大模型输出的Markdown一键转Word,小白也能秒变大神!
文章介绍了三种将大模型输出的Markdown格式文档转换为Word格式的方法:使用在线工具https://wxaiway.com/md2wd/和https://www.prompteditor.cn/markdown-editor/,或通过豆包直接输出为Word。这些工具操作简单,只需复制Markdown内容到对话框,即可实时预览并导出为Word格式,便于阅读和编辑,特别适合编程初学者和大模型开发者使用。
2026-01-05 18:05:39
888
原创 9种RAG架构全解析!从入门到生产,小白程序员也能玩转大模型检索增强生成,告别“一本正经胡说八道“!
本文详解RAG技术在AI大模型中的9种架构:标准RAG、对话式RAG、纠正性RAG、自适应RAG、自我批评RAG、融合RAG、HyDE、代理型RAG和GraphRAG。针对不同应用场景提供架构选择决策框架,强调从简单入手、基础扎实的重要性,帮助开发者构建可靠的RAG系统,减少大模型幻觉问题,提升AI应用的准确性和实用性。
2026-01-05 18:04:51
933
原创 “大聪明“变“真学霸“!Deep Thinking RAG架构让AI从检索到思考的飞跃,附完整代码实现
Deep Thinking RAG突破传统RAG瓶颈,通过LangGraph编排的循环推理机制,将RAG与Agent技术深度融合,实现从"工具"向"智能体"的范式跃迁。该架构具备自主规划、自适应检索、多源信息融合和自我纠错能力,解决了多跳推理、静态知识边界等问题,显著提升AI系统的认知能力和问题解决效率。
2026-01-05 18:04:13
639
原创 别再只学Prompt了!RAG才是大模型开发的真·王者,小白也能秒变AI大神
本文是一份关于RAG(检索增强生成)技术的全面实战教程,详细介绍了RAG的基本概念、技术架构及主要模块,包括版面分析、知识库构建、大模型微调、文档检索等。文章对比了RAG与直接使用LLMs的优势,以及RAG与SFT的区别,并提供了各模块的具体实现方法和技巧,最后推荐了几个优秀的RAG开源项目。通过本教程,读者可以全面了解RAG技术并掌握其实施方法。
2026-01-05 18:03:41
660
原创 【震惊】RAG技术重大突破!港中大&微信AI团队超图记忆框架HGMEM,让8B模型秒杀GPT-4o!
港中大与WeChat AI联合团队提出HGMEM框架,通过超图结构和动态记忆演化机制解决多步RAG系统的信息孤岛、推理深度不足和上下文理解局限三大痛点。该框架支持n元关系建模,实现记忆的更新、插入和合并操作,并结合自适应检索策略。实验表明,HGMEM在多个挑战性数据集上显著优于现有方法,甚至超越了使用GPT-4o的基线模型,实现从"检索-生成"向"理解-推理"的重要跃迁。
2026-01-05 18:02:49
1013
原创 【惊掉下巴】AI应用开发效率提升10倍的秘籍!LlamaIndex框架保姆级教程,小白也能秒变专家!程序员的“外挂“已送达!
LlamaIndex是一个拥有46.1k GitHub星标的开源框架,专注于解决大模型理解私有数据的难题。它提供160+数据连接器,支持PDF、数据库、API等多种数据源,并提供多种索引结构。通过简单的5行代码,开发者就能构建完整的RAG应用,实现数据与AI的完美结合。该框架采用模块化设计,支持多种嵌入模型和向量数据库,适用于企业知识库、智能客服等场景,是AI应用开发效率提升的利器。
2026-01-05 18:02:00
918
原创 AI革命!RAG技术全解析:让大模型告别“一本正经地胡说八道“,代码实战+原理图解!【小白必学】
检索增强生成(RAG)技术通过连接大语言模型与外部知识库,解决了LLMs知识静态性的局限,使其能够访问最新、特定和专有信息。RAG工作流程包括检索相关文档片段并增强提示,使LLM生成准确、可验证的响应。核心技术包括嵌入、语义搜索和向量数据库。Graph RAG和Agentic RAG等高级形式进一步增强了信息整合和推理能力,广泛应用于企业搜索、客户服务等领域,是提升AI知识性和可靠性的关键模式。
2026-01-05 18:01:15
717
原创 震惊!企业级RAG多级缓存架构让大模型准确率飙升到92%,小白程序员也能秒变AI专家!
文章介绍了大型语言模型(LLM)在企业应用中的"幻觉"问题,提出了"RAG上下文多级缓存"解决方案。该方案借鉴CPU分层缓存思想,通过L1主题筛选、L2语义匹配和L3事实回填的三级架构,结合结构感知切片和Re-ranker二次优化,解决了传统RAG检索慢、精度低的问题,使检索精度提升至92%以上,减少85%的LLM幻觉问题,满足企业核心场景的高精度要求。
2026-01-05 18:00:39
1094
原创 【AI内幕】大模型厮杀白热化!豆包碾压全场,DeepSeek杀出重围,编程小白如何抓住AI风口?
文章整理了2024-2025年国内外AI大模型活跃排行榜,显示国内市场豆包领先、Deepseek崛起,全球市场ChatGPT和Gemini占主导但中国模型逐渐获得全球认可。分析指出:入口比模型更重要,技术和口碑能打破平台垄断,全球AI模型分化为中英文两个世界,AI总日活量持续增长,全民AI时代已经到来。
2026-01-04 22:13:16
630
原创 爆肝总结!大模型开发必备知识体系:从架构模块到面试热点,一篇全掌握!
本文系统化梳理了大模型学习的三大维度:主流大模型架构模块(分词、嵌入、Transformer、训练目标等)、必须掌握的八大基础"八股"(线性代数、概率统计、注意力机制等)以及面试常见延伸考点(稀疏注意力、MoE、Prompt工程等)。文章提供了从打牢基础到动手实践的学习路径,帮助构建完整的大模型知识体系,适合初学者入门和开发者进阶。
2026-01-04 22:12:44
952
原创 AI编程“内卷“升级!智谱技术流VS MiniMax应用流,小白程序员的破局之路
中国AI大模型企业分化为两条路径:智谱AI专注技术底座和B端MaaS服务,MiniMax主打消费应用和C端产品。尽管路径不同,但两家公司都面临各自挑战,并可能殊途同归,向"两手抓"方向发展。AI企业在全球化过程中也面临区域差异、法规限制等挑战。对开发者而言,理解这两种路径有助于把握AI时代的发展机遇。
2026-01-04 22:12:12
856
原创 yyds!LlamaIndex框架大公开,小白也能让大模型读懂你的企业文档,效率提升10倍!
LlamaIndex是拥有46.1k星标的开源框架,通过160+数据连接器解决大模型无法理解私有数据的痛点。只需5行代码即可构建完整的RAG应用,支持PDF、Word、数据库等多种数据源。文章详解了其技术原理、应用场景、安装指南及与LangChain的对比,为小白开发者提供保姆级教程,是提升AI应用开发效率的利器。
2026-01-04 22:11:34
919
原创 AI Agent来了!你的编程工作会被替代吗?大模型开发者必读的市场变革指南
AI Agent正通过降低交易成本重塑市场,逼近"科斯奇点"。需求侧需要具执行力、判断力和理解偏好的Agent;供给侧呈现四象限模型,定价能力减弱;市场均衡提升效率但带来价格歧视等问题;监管需关注反垄断和责任归属。这一变革带来效率红利与新风险,结果取决于市场机制设计与监管。
2026-01-03 09:15:00
595
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅