- 博客(1597)
- 收藏
- 关注
原创 5 分钟用满血 DeepSeek R1 搭建个人 AI 知识库(含本地部署)
看到这里,相信你已经找到最适合自己的 DeepSeek 个人知识库方案了。如果你和大多数人一样,选择使用官方 API ,那就不用再为性能和本地硬件资源发愁;如果你恰好有充足的算力和技术储备,本地部署也是个不错的选择。不过,在整个过程中,我想和你分享的不仅仅是这些技术细节。而是一个中国团队能做出世界级大模型,一个需要 +86 才能注册的大模型。很庆幸,我们能作为中国 AI 技术进步的见证人。当然,暂时的领先不是终点。但 DeepSeek 给我们带来的,是“中国也可以”这份信心。
2025-02-05 16:07:16
9662
2
原创 2024年国内外最新AI大模型汇总(含ChatGPT、Claude、Kimi、文心、天工、讯飞、通义等10大主流AI大模型)
两年前,我和你谈论AI搜索时,你可能觉得我在做梦。但现在,梦想已经成真——信息搜索,知识工作者的新武器正如鲁迅先生所说:“输入的是垃圾,输出的也是垃圾。”在这个信息爆炸的时代,搜索能力成为了衡量知识工作者能力的关键。AI搜索的崛起AI搜索作为AI领域的热门赛道,正吸引着各路英雄豪杰。搜索引擎的两大类别:就像是我们的_私人助理,随时待命_,通过对话就能理解我们的需求,提供精准搜索结果。比如chatgpt、kimi、万知等。:这类搜索引擎则将AI技术融入搜索过程,让搜索结果更个性化、多样化。
2024-09-19 17:26:48
28218
原创 用国产长文本大模型写小说,这个太强悍了 !
GLM-4-Long是智谱 BigModel开放平台(bigmodel.cn)推出的一款先进语言模型,适用于需要大规模文本生成的应用场景。GLM-4-Long有很多的实际应用场景:比如说,解读企业年报、学习论文文献、公司财务报表、阅读长篇小说甚至是分析总结长视频。关键是价格非常亲民,100万 tokens 只需1元 ,这简直是白给了,良心定价!2。
2024-09-16 18:00:00
8427
原创 大模型学习宝典:收藏这五本书,告别碎片化,构建系统认知
本文强调在信息碎片化时代,学习大模型技术应选择系统性书籍而非碎片化知识。推荐五本不同类型的大模型书籍,分别适合入门、视觉学习、硬核修炼、知识构建和实战需求。作者认为,在AI领域,底层原理和系统性认知远比追逐热点更重要,通过系统学习可构建完整知识网络,这才是应对技术变化的根本。
2025-12-03 14:24:06
24
原创 【收藏必备】RAG系统三大核心技术详解:重排、压缩与校正
重排技术核心类型精准度效率适用场景RRF无训练中极高快速融合、低算力场景有监督高中核心业务、追求精准度ColBERT轻量交互中高中高平衡效率与精准度的通用场景API/开源高中无部署成本、多语言场景生成式极高低复杂语义、无标注数据场景时效加权重排业务定制极高时效性敏感的业务场景(叠加使用)重排技术的选择核心是“场景适配”:轻量验证选RRF,核心场景选Cross-Encoder/ColBERT,复杂语义选RankGPT,时效敏感场景叠加时效权重。
2025-12-03 14:22:29
180
原创 大模型ToT框架详解:思维树如何提升AI推理能力?建议收藏
ToT = Tree of Thoughts(思维树)这是一种让大语言模型能够探索多条推理路径的框架,通过构建思维树来系统地搜索问题空间,并自我评估选择最优解。ToT 是一种搜索增强的推理框架• 维护多个并行的推理路径(思维树)• 每个节点代表一个部分解或中间思考步骤• 系统地评估每个思维状态的价值• 支持前瞻和回溯(向前搜索,向后剪枝)• 通过搜索找到全局最优解,而非贪婪地选择局部最优。
2025-12-03 14:10:37
87
原创 收藏!Java开发者转型AI大模型完整路径,附学习资源与实战项目
Java开发者向AI大模型领域转型并非简单技术栈替换,而是工程能力价值升级。Gartner预测,2026年超80%企业将用生成式AI API或模型,兼具传统开发与AI能力的开发者将成稀缺资源。建议“保Java攻AI”:深耕Java岗位,拓展AI能力。优秀AI工程师是带工程经验的复合型人才,您积累的经验和思维在AI时代有用武之地。转型有挑战,但工程思维能“一次学习,多维应用”。当下是将Java积累转化为AI竞争优势的最佳时机。
2025-12-02 14:27:40
432
原创 【干货收藏】多智能体系统完全指南:AI协作的核心架构与实战应用
多智能体系统是由多个协作智能体组成的AI系统,通过任务分解和分工协作提升问题解决能力。文章介绍了监督者控制模式和去中心化协作两种主流架构,以及A2A协议这一标准化协作框架。通过奶茶订单实例展示了多智能体在实际应用中的协作流程,强调了设计好上下文(信息共享)是多智能体系统高效解决问题的关键。
2025-12-02 14:25:14
520
原创 【必藏】构建99%+可用性的RAG系统:大模型落地高可用实战指南
RAG系统中,向量库、LLM、知识源等多个服务相互依赖。若向量库响应变慢,LLM服务因等待超时而堆积请求,可能引发级联失败此时需引入熔断机制当错误率或延迟超过阈值,自动“熔断”依赖调用;进入熔断状态后,直接返回fallback响应(如缓存结果或默认提示);经过冷却期后尝试半开恢复,逐步试探服务是否可用。在Go生态中,可使用Sentinel(阿里开源)或自研基于滑动窗口的熔断器。错误率阈值:如5秒内错误率>50%则熔断;最小请求量:避免低流量时误判;熔断时长:如30秒后尝试恢复。
2025-12-02 14:23:52
554
原创 【收藏】AI Agent与Agentic AI技术全解析:从技术原理到落地应用
OpenAI应用研究主管Lilian Weng提出的“Agent=大模型+规划+记忆+工具”是行业公认框架,我们用“点外卖”场景拆解:• 大模型(大脑):理解“想吃清淡午餐,预算50元以内”的需求,判断需调用外卖平台工具;• 规划(拆解任务):将“点外卖”拆分为“定位当前地址→筛选符合预算的轻食店→查看用户评分→推荐3款热销餐品→确认后下单”5个步骤;• 记忆(存储信息):短期记忆记住“不吃香菜”的即时要求,长期记忆(外部向量数据库“云端笔记本”)调取上周点过的3家轻食店记录,优先推荐好评商家;
2025-12-02 14:19:51
376
原创 AI Agent从入门到实战:实现官方长期记忆,让AI真正“认识“你
本文介绍了如何为AI Agent实现官方版长期记忆,使其能够持久化存储和检索用户信息。文章首先区分了会话记忆、长期记忆和RAG的概念差异,然后详细讲解了LangChain 1.0+版本中记忆模块的变化,最后通过实战代码演示了创建读写工具、初始化记忆库、定义上下文结构等步骤,让Agent能够"认识"并记住不同用户的信息,为后续个性化服务奠定基础。
2025-12-01 17:24:25
921
原创 从规则到AI原生:构建智能客服的评测与优化体系,收藏学习大模型应用实战
本文详细介绍了智能客服从基于NLP的传统规则系统到基于RAG,再到AI原生的演进历程,重点阐述了如何构建"评估-诊断-优化"三位一体的运营Agent平台,实现客服机器人服务质量的持续进化。文章分享了在实际应用中遇到的挑战及解决方案,包括LLM随机性处理、上下文工程、业务场景强依赖等问题,并通过实际案例展示了该体系在提升客服效果方面的价值,为开发者提供了大模型在客服领域落地的实践经验。
2025-12-01 17:22:59
578
原创 智能体开发必看:从基础通信到RAG架构,构建高效大模型应用(建议收藏)
所谓幻觉(Hallucination),是模型在缺乏真实知识支撑时,会根据语言统计规律“合理地胡说”。这个问题几乎存在于所有的大模型中,因为模型的知识都停留在训练数据里。
2025-12-01 14:33:30
658
原创 企业级AI Agent实战指南:程序员必学的数字化转型利器,值得收藏
AI Agent正成为企业数字化转型的核心基建,通过自主感知、决策与执行能力破解企业人力成本攀升、流程冗余等挑战。MCP标准为其与外部系统交互提供支持,使Agent从单一工具进化为自主决策单元。典型应用场景包括客户服务、销售营销、内部运营和研发创新。企业可通过五个阶段落地AI Agent,从办公场景试水到构建Agent中台,实现企业智能化升级。
2025-12-01 14:31:04
1015
原创 2025年程序员必看!大模型领域8大高薪岗位转型指南,建议收藏
本文介绍了程序员转型AI大模型领域的8大热门岗位及职业发展建议,详细阐述了从基础知识学习到项目实践的转行步骤。文章强调国内大模型人才稀缺,2025年存在巨大职业机会,并提供了系统学习资源。持续学习、积累实战经验、建立人际网络和寻找导师是成功转型的关键。
2025-12-01 14:20:42
690
原创 多模态Transformer核心难题:不同模态序列长度差异的解决方案(必看)
多模态Transformer面临的核心挑战是不同模态(图像、文本、语音)序列长度差异巨大。主流解决方案有三种:1)统一长度:通过下采样或补齐使序列一致,但会丢失信息或浪费算力;2)跨模态对齐:各模态独立编码后通过cross-attention对齐,计算效率高,如CLIP、BLIP等;3)动态建模:根据内容相关性自适应选择代表性token,平衡算力和精度。Transformer作为通用模态接口,将一切转化为token序列,用统一注意力机制建模不同模态。这其实是一个非常典型、但又容易被忽略的问题。
2025-12-01 14:17:23
828
原创 从入门到精通:RAG与GraphRAG技术对比及适用场景分析,建议收藏
文章提出了GraphRAG-Bench评测基准,对比分析了RAG与GraphRAG在知识表示、检索机制和性能上的差异。研究显示,GraphRAG在复杂推理、上下文摘要和创造性生成任务中表现优异,但在简单事实检索中不如传统RAG。GraphRAG更适合医学诊断、法律分析等需要深度理解的任务,但实现复杂度和资源消耗较高。最近的研究报告称,在许多实际任务中,GraphRAG的表现往往不如普通的RAG。因此产生一个问题:GraphRAG真的有效吗?在哪些场景下,GraphRAG有收益?
2025-11-30 13:45:00
1603
原创 程序员必读:一文搞懂AI生态中的LLM、RAG、MCP、Agent概念与关系【建议收藏】
听懂掌声。没听懂也不要紧,接下来细说这些名词具体都是干嘛的。
2025-11-30 10:45:00
580
原创 【干货收藏】程序员必学!手把手教你从零微调大模型,附AGI独家资料包
微调大模型需高电脑配置,如 GPU 环境,即在预训练基础上对大模型小训练。无需担心,本文用阿里魔塔社区集成环境,无需自备电脑配置环境,有浏览器即可完成。本次微调零一万物的 Yi 开源大语言模型,微调其他大模型过程和原理类似。话不多说,直接开始。
2025-11-29 15:24:45
810
原创 【程序员必看】GraphRAG入门指南:构建超越传统RAG的知识图谱问答系统(建议收藏)
从传统RAG到GraphRAG,这不仅是技术的升级,更是思维方式的转变。我们不再只是被动地检索信息片段,而是主动构建知识的结构。大模型也不再只是做语言匹配,而是真正在理解和推理。虽然GraphRAG还不是完美的(毕竟也依赖于大模型的抽取质量),但方向是清楚的——让AI系统更像人类思考一样,理解信息之间的关系,看到知识的全貌。如果你的业务涉及复杂的知识库问答,值得尝试一下。而且现在有免费的云服务可以用,技术上的壁垒已经不那么高了。
2025-11-29 15:23:16
879
原创 从GPT-5到盘古:2025年AI大模型排行榜,一篇看懂全球AI格局,值得收藏
本文分享了2025年全球十大AI大模型排行榜,包括OpenAI的GPT-5、Google的Gemini 2.0 Ultra、DeepSeek等,从技术性能、应用场景等维度进行了分析。文章指出中国AI大模型已占60%,形成中美双极格局,且AI发展正从单一性能转向垂直应用场景。DeepSeek、讯飞和豆包在应用层表现突出,将成为下一阶段AI发展的引领者。
2025-11-28 14:49:53
1928
原创 【必收藏】AI大模型:程序员的下一个风口,薪资逆势上涨150%
AI大模型正成为程序员的职业新风口,大厂80%招聘岗位与AI相关,薪资逆势上涨150%。传统CRUD开发逐渐被AI原生应用替代,掌握RAG优化、模型微调等技能将成为求职基本门槛。AI大模型应用开发提供广阔职业空间,是程序员不容错过的转型机遇。
2025-11-28 14:42:34
917
原创 【必学收藏】小白也能看懂的AI Agents与Agentic AI全解析:从入门到实战应用
论文综述系统性区分AI Agent(智能体)与Agentic AI(自主式AI系统),并通过构建结构化的概念分类体系、应用映射与挑战分析,阐明两者在设计哲学与能力上的差异。论文将AI Agent界定为由LLM(大型语言模型)和LIM(大型推理模型)驱动的模块化系统,主要用于特定任务的自动化。生成式AI(Generative AI)被视为其前身,而AI Agent则通过工具集成、提示工程(prompt engineering)和推理增强实现进一步发展。
2025-11-28 14:40:43
711
原创 【必学收藏】大模型Agent交互设计指南:从三阶段旅程看设计原则与实战案例
文章讨论了大模型Agent产品的交互设计原则与挑战,提出三大基石:透明可释、认知减负、人在环路。将Agent使用过程分为任务启动、过程执行和结果交付三个阶段,分析各阶段的核心挑战及应对策略,并结合Datadog、Atlassian Rovo等10多个实际产品案例进行说明。文章强调Agent设计应以人为中心,通过透明与可控的体验建立信任,让人机协作更自然高效。
2025-11-27 18:30:23
244
原创 值得收藏!AI产品经理实战全流程图:从需求洞察到持续运营
本文详细拆解了AI产品经理的工作全流程,涵盖需求定义、方案设计、协作开发、数据闭环、效果评估和持续运营六大阶段。文章指出80%的AI产品问题源于对工作全流程的认知模糊,并提供了每个阶段的关键动作和产出物。强调AI产品经理的核心竞争力不是技术知识,而是在模糊中锚定目标、在黑盒中建立可控路径、让AI真正服务于人。文章还分享了建立数据闭环防止模型"静默衰退"、采用三层评估体系衡量业务价值等实用方法,帮助AI产品经理避开高频踩坑点。
2025-11-27 18:29:24
543
原创 AI架构未来:大模型技术全解析,程序员收藏学习宝典
文章探讨了AI技术如何架构未来,分析了从单体应用到云原生再到AI时代的架构演进。作者预测未来将出现个性化政府服务、认知型企业和超级个体;技术上将发展对话式操作系统、自然语言编程和人体集成硬件。文章强调每个人应从AI"使用者"转变为"共建者",提升"AI素养",成为"架构师",用智慧和责任共同构建智能温暖的未来世界。
2025-11-27 18:26:23
1033
原创 【必收藏】LoRA技术详解:用0.01%参数量实现大模型高效微调
Lora为PEFT 基于重参数化(Reparametrization-based)训练方法。全称low-rank adaptation of large language models。为了使微调更加高效,LoRA的方法是通过低秩分解将权重更新表示为两个较小的矩阵(称为更新矩阵)。这些新矩阵可以在适应新数据的同时保持整体变化数量较少进行训练。原始权重矩阵保持冻结状态,并且不再接受任何进一步的调整。最终结果是通过将原始权重和适应后的权重进行组合得到。“低秩”(Low-Rank)是一个线性代数中的概念。
2025-11-27 14:34:10
418
原创 建议收藏!大模型三大集成协议深度解析:MCP、A2A与AG-UI开发指南
总体而言,MCP、A2A 和 AG-UI 这三个协议分别解决了大模型应用开发中不同层面MCP提供模型对接外部数据与工具的统一接口,被誉为“AI应用的USB-C端口”。它解决的是“一个智能体如何接入外部资源”的问题,让开发者不再为每种数据源写繁琐的适配代码。A2A则建立了智能体之间协作的共同语言,可视作“AI智能体的网络协议”。它重点解决“多个智能体如何互相对话协同”的问题,为跨平台、多Agent的复杂系统奠定了标准基础。AG-UI专注于智能体与用户界面的实时交互,被喻为。
2025-11-27 14:29:57
985
原创 收藏!大模型架构全面解析:Kimi、Qwen、MiniMax等最新技术对比
本文对比分析了Kimi K2 Thinking、Qwen3 Next、MiniMax-M2和Kimi Linear等最新大语言模型的架构特点。内容包括不同模型的注意力结构(全量vs混合)、上下文长度(最高262k)、模型规模(1T-230B)、专家处理机制等技术参数。这些模型代表了当前大语言架构从传统全量注意力到混合注意力及思考模型等创新方向的技术演进。要点:QK的正则采用了分头处理;230B:激活参数10B, 单Token由8个独立专家处理,无共享专家;
2025-11-26 14:48:18
415
原创 大语言模型(LLM)学习宝典:从小白到专家的必备收藏指南
大语言模型本质上是“用海量数据训练出来的语言专家”,它的核心是通过Transformer理解文字关系,经过预训练和微调后,能在各种场景帮人干活。虽然听起来复杂,但对普通人来说,不用懂原理,会用它提高效率(写东西、查信息)就够了~ 随着技术发展,它会变得越来越“聪明”,像手机一样成为日常工具。
2025-11-26 14:47:08
987
原创 收藏!大模型四大方向全解析:从数据治理到部署落地,新人转行少走弯路指南
文章详解AI大模型四大方向:数据治理、平台搭建、模型算法和部署落地,各方向工作内容与技能要求。建议新人选择垂直领域深耕,重视数据积累与工程能力,不必只关注算法。大模型算法岗竞争激烈,可从平台方向入手,逐步拓展。强调数据质量、平台基建对大模型成功的关键作用,帮助新人规划职业路径。
2025-11-25 17:24:33
323
原创 大模型架构完全指南:业务、应用、数据、技术架构全解析(收藏版)
AI大模型正从实验室走向产业,成为重构商业逻辑的关键力量,引发IT架构全面变革。业务架构从"辅助"人到"替代"人重构流程;应用架构将人的能力内嵌为系统组件;数据架构升级为多模态"模型教材";技术架构从"外挂调用"转向"原生内嵌"。这场变革本质是"智能"从IT架构附加组件变为核心组件的过程,需要通过渐进式投资实现架构升级。
2025-11-25 17:23:36
367
原创 【干货收藏】智能体(AI Agent)详解:为什么它是普通人必备的AI助手?
文章介绍智能体(AI Agent)作为能真正动手做事的AI助手,在信息过载、时间稀缺和技术进步的当下,能帮助人们过滤信息、解放时间、简化操作。它在工作、生活、家庭场景中广泛应用,解决旅行规划、健康管理、学习辅导等问题。尽管存在技术门槛、工作替代和隐私安全等顾虑,但智能体能让人专注于更需要人类智慧的方面,通过从小需求开始使用,提升生活质量和时间自主权。
2025-11-25 17:22:33
911
原创 【收藏必备】MCP协议实战解析:微软Teams如何打破生态壁垒,实现大模型与工具深度集成
MCP 协议对工具调用的输入格式、输出格式、交互流程做了严格的标准化定义。例如,所有工具调用请求必须包含method(工具名称)、params(参数)、id(请求标识)等字段,返回结果需包含result(数据)或error(错误)字段。这种统一的格式让不同厂商的大模型(如 GPT、Claude、Llama)、工具(如天气 API、支付系统、企业数据库)都能基于同一套 “语言” 交互。
2025-11-25 15:37:08
355
原创 大模型文本分块完全指南:原理、方法与高级技巧(收藏必学)
本文详细介绍了文本分块在大模型应用中的重要性及实现方法。首先阐述了文本分块的原理及如何确定模型最大上下文长度,分析了分块大小对检索精度的影响。随后系统讲解了多种分块方法,包括基于字符的分割、递归分割、代码特定分割和语义分割等,并介绍了Unstructured工具的高级分块策略。最后探讨了与分块相关的高级索引技巧,如滑动窗口、父子文本块和元数据创建等,为构建高效的大模型应用提供了全面指导。
2025-11-25 15:31:36
920
原创 大模型技术全解析:第四次技术革命的核心,小白入门到进阶,建议收藏
文章全面介绍大模型作为第四次技术革命的核心,涵盖算法、算力、数据三大驱动要素及相关概念。详细阐述大模型特点、训练三阶段(预训练、微调、对齐)及检索增强生成、智能体、混合专家模型等关键技术,并介绍DeepSeek、异构计算平台、行业应用与实践路径,为小白和程序员提供从入门到应用的大模型学习指南。
2025-11-24 21:35:16
735
原创 【必学收藏】AI战略实践全解析:从技术应用到商业价值闭环的实战经验
苏商银行通过高强度AI投入,将AI定位为数字化转型核心引擎,年均投入3000万元用于AI研发。构建"AI大模型应用平台+AI算力平台"双引擎,引入DeepSeek系列技术优化推理效率,在信贷风控、智能研发等60+场景应用成效显著,实现材料识别准确率97%+、代码采纳率提升28%等成果。其经验在于场景精准化、技术开源化及生态协同化,为中小银行AI转型提供低成本高效率路径,成为行业范本。
2025-11-24 21:34:18
981
原创 【必藏】AI大模型入门指南:大学生如何快速进入AI领域(技术/非技术双路径)
文章介绍了AI大模型背景下大学生如何进入AI领域的学习路径。根据技术背景分为两类:技术背景学生可聚焦算法开发,强化数学和编程基础;非技术背景学生可转向产品经理等岗位。文章详细列出了技术岗的4步学习路径(基础技能、机器学习算法、神经网络和大模型)和非技术岗的3步学习路径(AI工具使用、行业应用和项目验证),并对比了两类方向的目标岗位、核心技能、学习路径等,为不同背景的学生提供了清晰的AI入门指南。
2025-11-24 21:33:07
709
原创 收藏!Java程序员的AI变现指南:从“炼丹师傅“到“造轮子专家“的闷声发财之路
Java程序员在大模型时代应发挥工程化优势,成为"造轮子专家"而非"炼丹师傅"。通过封装大模型API、构建高性能系统、对接业务场景,实现AI能力落地。具体方法包括调用大厂API服务、改造现有代码为智能系统、专注模型服务基建等。避开研究模型训练的误区,专注将AI技术与Java工程结合,成为连接AI技术与实际业务的桥梁,获取AI红利。
2025-11-24 21:31:56
1014
原创 小白&程序员必藏!大模型入行指南:选对方向少踩坑
很多人问:“现在转大模型,是不是更容易就业?能避开35岁焦虑吗?答案是肯定的,但有前提。大模型作为新兴技术,人才缺口确实很大,尤其是既懂技术又懂业务的复合型人才,企业往往愿意开出高薪。但想在这个风口站稳脚跟,不是靠“跟风”就行,你需要:先根据自身背景选对方向,避开“重模型轻问题”“追热点轻底层”的坑,沉下心把核心能力练扎实。技术风口总会迭代,但扎实的能力永远是底气。希望这篇文章能帮你在大模型的赛道上,少走弯路,快速找到属于自己的方向。
2025-11-24 14:46:59
590
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅