- 博客(2065)
- 收藏
- 关注
原创 LLM大模型学习:LLM大模型推理加速
文 Mia / 叶娇娇 推理优化部署、推理加速技术是现在,尤其在大模型时代背景之下,消费级 GPU 和边端设备仍为主流的状况下。推理加速是实际工程落地的首要考虑因素之一,今天笔者来聊聊涉及到的可以实现大模型推理加速的技术。
2024-09-08 09:15:00
2414
1
原创 必备收藏!大模型高频面试题汇总及答案解析
在原始 PLM (Pre-trained Language Model) 旁边增加一个旁路,做一个降维再升维的操作,来模拟所谓的 intrinsic rank。训练的时候固定 PLM 的参数,只训练降维矩阵A与升维矩阵B。而模型的输入输出维度不变,输出时将BA与PLM的参数叠加。用随机高斯分布初始化A ,用0矩阵初始化B,保证训练的开始此旁路矩阵依然是 0 矩阵。
2024-08-09 10:49:42
1635
1
原创 传统产品经理VS现在AI产品经理,你要学习的太多了,超详细收藏我这一篇就够了
传统产品经理想要转行成为AI产品经理,需要经历一系列的学习和实践过程。下面是一份详细的学习路线图,旨在帮助你顺利转型。学习路线图了解AI基础知识AI概览:阅读《人工智能:一种现代的方法》这样的书籍,以获得对AI领域的整体理解。在线课程:通过Coursera、edX等平台上的课程,学习AI的基础概念,例如机器学习、深度学习等。掌握核心技能编程基础:熟悉Python编程,这是AI开发中最常用的编程语言之一。数据处理:学习如何使用Pandas、NumPy等工具处理数据。
2024-08-01 11:51:04
1347
1
原创 AI大模型入门宝典:全面知识点解析,新手必备干货大全!
当我们提及大模型时,通常指的是大语言模型(Large Language Model,简称LLM),即文字问答模型,其典型代表便是OpenAI的GPT系列。然而,随着技术的日新月异,大模型已经不单单局限于自然语言处理(Natural Language Processing)领域的发光发热,而是逐渐渗透到了其他多个领域。
2024-07-13 10:41:51
2145
1
原创 清华博士带你掌握 Llama 大模型 40 节课助你涨薪 120%
可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
2024-06-07 17:48:23
1794
1
原创 GraphRAG如何实现智能跃迁?它能处理超长文档、应对复杂推理,才是企业级AI应用的未来!
GraphRAG通过引入知识图谱将非结构化数据转化为结构化认知,解决了传统RAG在处理复杂关系时的瓶颈。它实现了多跳推理、全局摘要和可解释性溯源三大技术飞跃,使大模型从"搜索数据"升级为具备"推理洞察"的智能系统,为企业AI应用提供了更强大的认知能力,虽面临构建成本和维护挑战,但代表了大模型知识增强的重要方向。
2025-11-24 16:13:48
307
原创 AI大模型应用开发,别再走弯路了!这份保姆级「学习路线图」,带你从入门到精通!
AI 大模型应用开发作为新兴领域,不断出现新的技术:LLM、Prompt、RAG、Agent、Fine-tuning、MCP 等,本文聚焦 AI 大模型应用开发,带领大家入门,带领大家了解 AI 大模型应用开发的全攻略。
2025-11-24 16:06:39
1098
原创 AI产品经理面试宝典:RAG、Agent、Prompt工程30个高频问题全解析!
文章摘要:本文介绍了大模型产品经理面试中的技术理解类问题,涵盖Transformer架构、RAG系统、模型评估指标、提示词工程等核心知识点。重点解析了Transformer的自注意力机制对大模型发展的影响,RAG系统的检索增强技术实现,以及准确率、F1分数等关键评估指标的应用场景。同时对比了模型微调与提示词调优的优缺点,并给出思维链提示词的设计实例。这些内容有助于面试者系统掌握大模型技术原理及工程实践要点。
2025-11-24 15:55:37
299
原创 AI智能体架构演进:从Agent 1.0到Agent 2.0,深度智能体如何征服复杂任务?!
DeepAgent是一个突破传统浅层工具调用循环的AI Agent开发框架,通过模块化中间件架构提供深度思考能力。核心特性包括完整文件系统操作、灵活持久化策略、子智能体机制及生产级特性如自动摘要、工具修复和Human-in-the-Loop。这些能力使开发者能构建处理复杂任务的生产级AI Agent系统,无需从零实现基础设施。
2025-11-24 15:29:23
811
原创 大模型上下文管理秘籍:一招解决智能体异常终止,提高应用稳定性!大模型应用开发
文章分析了大模型应用中智能体异常终止的原因是上下文窗口超长,指出问题在于历史记录管理不当。作者提出使用TrimmedInMemorySaver类过滤思考过程和工具调用结果,只保留对话内容,以控制上下文长度,提高应用稳定性。这种方法虽会导致部分记忆丢失,但能有效防止上下文超长问题。
2025-11-24 10:31:07
245
原创 无需依赖模型蒸馏!RepoSearch-R1:蒙特卡洛树搜索驱动的LLMs代码库探索新方法!
浙江大学与阿里通义灵码团队提出RepoSearch-R1框架,基于蒙特卡洛树搜索(MCTS)驱动强化学习,使LLMs能够通过自训练生成多样化推理轨迹,无需依赖模型蒸馏。该框架通过MCTS引导轨迹生成、轨迹选择与奖励计算、优势计算与GRPO训练三个阶段,构建了专为代码库问答设计的RepoQA-Agent。实验证明,该方法能有效提升LLMs理解复杂代码库结构和检索相关信息的能力,在代码库问答任务中表现优异。
2025-11-23 07:30:00
477
原创 【万字长文】AI也有记忆?上下文工程与记忆系统实战指南,打造有状态的AI!
文章探讨了从"提示工程"到"上下文工程"的范式转变,旨在解决大语言模型的"无状态"缺陷。通过构建动态工作环境,结合会话(临时工作台)和记忆(长期知识库)两大支柱,使AI能够实现个性化交互和持续学习。文章详细阐述了上下文工程的构成要素、动态工作循环,以及记忆系统的核心能力、分类和生成流程,为开发者提供了构建有状态智能体的完整方法论。
2025-11-23 07:00:00
531
原创 AI领域薪资揭秘!大模型算法工程师月薪5W!!2026 AI人才趋势全解析!
2026年AI人才需求持续上升,大模型算法岗月薪可达5.2W,企业更看重实际项目能力而非名校学历。近60%高科技企业将AI人才视为核心招聘指标,头部企业开始规模化布局。AI在创造研发和支持类岗位的同时,也对重复性岗位造成冲击。数学与算法基础(60.3%)和实际项目经历(52.5%)是企业选拔人才的首要考量因素。高素质高潜力的AI应届生,尤其是算法基础和项目实践突出的竞争者,将成为最大赢家。
2025-11-22 11:45:25
639
原创 AI编程助手升级:变身代理小队,程序员编码效率提升50%的实战秘籍!
分享如何将AI从"搜索框"转变为"代理小队"(SCCR框架:Spec/Context/Code/Review),通过明确角色分工,在不牺牲代码质量的前提下替代约一半编码时间。实际应用显示,中等特性开发从7小时缩短至3小时,bug修复从3小时减至1.5小时。作者强调这不是取代工程师,而是让他们专注于设计决策和系统架构,同时提供了简单架构实现和逐步引入方法,帮助开发者适应AI-first的工作方式。
2025-11-22 11:44:02
774
原创 【收藏级干货】大模型落地难?企业突围攻略,解锁AI应用成功秘诀!
文章讲述企业如何成功落地AI大模型技术。首先应回归第一性原则——以客户和业务为中心,其次业务需求导向是落地最优解,需充分理解行业痛点。同时要清晰认知大模型能力边界,避免"幻觉问题"。组织与团队转型是基础保障,全员需掌握与AI沟通的技能。企业应采用API调用模式,技术人员需具备学习能力、工程能力和微调能力,实现大模型在企业的高效应用。
2025-11-22 10:40:35
720
原创 AI大模型算法工程师转型指南:从零基础到精通,深度解析行业趋势与职业前景!
从ChatGPT到新近的GPT-4,GPT模型的发展表明,AI正在向着“类⼈化”⽅向迅速发展。GPT-4具备深度阅读和识图能⼒,能够出⾊地通过专业考试并完成复杂指令,向⼈类引以为傲的“创造⼒”发起挑战。现有的就业结构即将发⽣重⼤变化,社会⽣产⼒的快速提升将催⽣新的⾏业和岗位机会。如何与⼈⼯智能协同⼯作,利⽤AI辅助办公已经成为各⾏从业者的必修课。脉脉创始⼈兼CEO林凡认为,从“⼈⼯智障”向“⼈⼯智能”的进化节点,是⼤模型的出现。
2025-11-21 15:48:09
927
原创 想入门LLM开发却不知从何下手?这份2025年最新学习路线图已助数百人成功转型!
“我只用了三个月就掌握了LLM应用开发,现在薪资比之前做传统后端开发高了40%。”一位刚转型成功的程序员在技术论坛上分享道。这样的案例在2025年已不罕见,随着ChatGPT、文心一言等大模型的普及,AI技术正重塑各行各业。无论是零基础小白,还是希望转型的技术工程师,系统化的LLM学习路线已成为抓住AI红利的关键。本文将为你揭示从零基础到LLM实战高手的完整学习路径。
2025-11-21 15:43:37
662
原创 【收藏级干货】Gemini 3技术深度解析——大模型学习的必经之路与未来方向!
谷歌DeepMind发布Gemini 3 Pro,在多项AI基准测试中排名第一,视觉智能和推理能力大幅提升。该模型通过"代理式编码"和"可视化编码"创新重塑开发者与AI协作模式,发布当天即集成Google搜索,实现数十亿用户覆盖。被视为谷歌在AI竞赛中找回节奏的关键一步,将加剧全球模型竞争,但其真正价值仍需在产业落地中验证。
2025-11-21 15:40:27
1048
原创 RAG技术深度解析:解决AI幻觉问题的利器,金融、医疗、客服领域的应用与未来!
RAG(检索增强生成)技术通过"先查证,再说话"的方式,有效解决了AI幻觉问题。其三步工作流程(问题处理、智能检索、证据增强生成)使AI能从可靠知识库获取信息,确保回答准确性。相比传统AI,RAG具备知识实时更新、回答可追溯、降低幻觉风险和保护数据隐私四大优势,已在金融、医疗、客服和教育领域广泛应用,未来将向多模态检索和个性化方向发展。
2025-11-21 15:39:05
1021
原创 LangChain V1.0智能体创建全攻略:从小白到高手的进阶指南!
本文详细介绍了LangChain V1.0中智能体(Agent)的创建新机制,重点讲解了create_agent()方法作为构建智能体的标准入口。文章从环境准备开始,逐步讲解了如何导入模型、工具(内置和自定义)、构建短期记忆、设置提示词以及调用智能体的完整流程。通过实际代码示例,展示了基于LangGraph的执行机制如何将"模型调用→工具决策→工具执行→结果整合"这一闭环封装成统一流程,使智能体构建更加简洁、工程化和生产可用。
2025-11-21 15:37:38
818
原创 程序员都说卷不动了,那要不要转型AI大模型?
“我们团队最年轻的大模型工程师只有25岁,年薪却已经接近百万。”一位来自头部互联网企业的技术总监透露,“但一位35岁的传统Java开发工程师,投出上百份简历却很难获得面试机会。”这种强烈的对比正发生在2025年的技术圈。猎聘数据显示,AI相关职位同比增加321.7%,而大模型算法岗位人才供需比仅为0.17,相当于6个岗位争夺1个人才。与此同时,传统开发岗位的需求正在萎缩。
2025-11-20 16:28:21
982
原创 零基础也能成为AI产品经理!超详细入门教程,非常详细,收藏这一篇就够了!
AI发展至今大致按照在产业结构上的分工不同产生了三种类型的公司,我们在转型时最好要先明确自己的优势及兴趣,来判断自己适合着眼于哪个层面的工作,从而进行针对性的学习和提升。
2025-11-20 16:27:44
658
原创 【技术干货】医疗AI智能体实战:开源项目MedRAX带你入门胸部X光大模型应用!
本文介绍了MedRAX,首个专门用于胸部X光解读的多功能AI智能体系统。该系统无需额外训练即可整合多种专业分析工具,在2500个复杂医疗查询的ChestAgentBench基准测试中表现优异。MedRAX采用基于ReAct循环的架构,集成视觉问答、图像分割、报告生成等多种医疗工具,支持并行执行和灵活部署。这一创新为自动化胸部X光解读系统的实际部署奠定了基础,具有广阔的临床应用前景。
2025-11-20 16:24:30
906
原创 【万字长文】LLM Prompt工程宝典:涵盖12大场景的实用技巧,小白到程序员都值得收藏!
本文全面介绍大语言模型(LLM)的Prompt Engineering技术,涵盖零样本/少样本提示、推理与逻辑、减少幻觉、用户界面、微调优化等12大核心领域。每种技术包含原理说明、应用场景和效果评估,为开发者提供系统化的Prompt工程知识体系,帮助提升LLM应用效果,解决从简单任务到复杂推理的各种挑战。
2025-11-20 16:23:31
661
原创 SFT记忆数据,RL学习规则:大模型后训练技术全面对比与实战指南!
本研究比较了监督微调(SFT)和强化学习(RL)两种大模型后训练技术的效果。发现RL能够学习可泛化规则,在文本和视觉环境中均能很好地泛化到未见过的变体;而SFT倾向于记忆训练数据,难以泛化到分布外数据。虽然RL泛化能力更强,但SFT对稳定模型输出格式至关重要,是有效RL训练的基础。此外,增加推理时间计算可提高泛化能力。
2025-11-20 16:21:59
540
原创 大语言模型(LLM)超全解析:从基础概念到技术演进,收藏这篇就够了!大模型学习
近年来,以ChatGPT为代表的大语言模型(LLM)引发了人工智能领域的一场革命。从聊天对话到内容创作,从代码生成到科学推理,这些模型展现出的能力令人惊叹。但究竟什么是大语言模型?它们是如何从早期的简单对话系统演进到今天如此强大的状态?背后的核心技术原理是什么?本文将为你一一解析,带你全面了解大语言模型的核心知识。
2025-11-19 16:44:03
1055
原创 大模型Embedding选择方法论:6步框架助你精准选型!
本文提供了一个六步评估框架帮助选择合适的Embedding模型:明确业务需求、评估数据特性、调研可用模型、评估候选模型、规划集成部署以及进行全链路测试。文章强调,最适合的模型并非总是基准测试分数最高的,而是最符合业务实际需求和技术约束的。在Embedding模型快速发展的当下,建议定期回顾选型,及时更新解决方案以获取最大收益。
2025-11-19 16:42:15
519
原创 算法工程师如何突破职业天花板?从技术到业务思维的蜕变之路,建议收藏!
本文是算法工程师职业成长经验分享,强调从技术思维向业务思维转变的重要性。作者通过自身经历指出,高级算法工程师需具备问题拆解和设计能力,不应仅做"论文翻译员"和"模型试错师",而应成为"最懂数据"的团队,理解并活用数据实现业务目标。文章分享了突破成长障碍的方法,包括跨领域协作和参与产品形态设计,帮助算法工程师实现从初级到高级的蜕变。
2025-11-19 16:40:06
470
原创 大语言模型已“死”?AI下阶段该做什么?一文带你了解AI未来趋势!
Sutton作为大语言模型奠基人提出LLM无法实现AGI的观点,主要基于三点:数据无法揭示因果关系、世界本质是混沌模型而非逻辑模型、训练数据堆砌有极限。当前AI发展趋势正从基础大模型转向应用层面,混合神经网络架构系统被视作更有可能实现AGI的路径。产业投资也已从基础大模型转向行业小模型和具体AI应用产品。
2025-11-19 16:36:57
897
原创 100行代码深度解析MCP协议:从原理到实践,打造更强大灵活的AI应用集成方案!
文章详细解析了Model Context Protocol (MCP)的通信原理和SSE接入模式,通过约100行Python代码实现了简化的MCP服务。MCP采用有状态的双向RPC模型,结合事件驱动特性,支持动态能力协商和功能发现,为AI应用与外部系统集成提供了独特优势。深入理解MCP原理有助于超越简单SDK使用,创建更强大灵活的AI应用集成方案。
2025-11-19 16:35:14
735
原创 2025年大语言模型就业揭秘:技术演进、核心技能与职业路径全解析!
随着大语言模型(Large Language Models, LLMs)技术的持续突破,人工智能领域正加速从通用对话交互向任务驱动的智能体(Agent)系统转型。截至2025年4月,企业对LLM领域专业人才的需求呈现爆发式增长,核心能力聚焦于检索增强生成(RAG)、智能体任务自动化、模型对齐优化及多模态融合四大方向。本文将系统梳理2025年大模型就业市场的技术发展脉络、核心技能体系、行业落地场景、高价值实践项目及职业发展策略,为从业者提供兼具前瞻性与实用性的职业规划参考,助力其精准捕捉行业机遇。
2025-11-18 11:02:00
1268
原创 后端开发凛冬已至?70份简历仅3个面试,薪资下降10%!3大突围策略揭秘
“我有8年传统Java开发经验,被裁后投了300多份简历,210天里只收到5次面试邀请。有家小公司愿意录用,但月薪从之前的1.5万降到1万,还取消了年终奖和补充医疗——他们说现在更想要懂AI开发的人。”这并非个例。2025年,后端开发者的求职环境正经历剧烈变化。一位求职者在社交平台分享了自己的经历:“投递70份简历,仅获得3个面试机会,唯一的工作邀请还比上一份工作薪资低了10%。”
2025-11-18 10:56:02
1662
原创 Vgent框架:基于图谱增强的大模型长视频理解新突破,性能提升5.4%!
Vgent框架是由沙特阿卜杜拉国王科技大学和Meta AI提出的基于图的检索推理增强生成框架,通过构建视频语义图谱和结构化推理机制解决长视频理解挑战。该框架采用四阶段流水线设计:离线视频图谱构建、基于图的检索、结构化推理和多模态增强生成。实验表明,Vgent在MLVU基准测试上实现3.0%-5.4%的性能提升,相比传统RAG方法保持时序连贯性并减少检索噪音,为长视频理解领域带来重要突破。
2025-11-18 10:53:05
569
原创 AI大模型架构新高度:从RAG到知识中台,企业如何构建核心AI能力?
文章提出了AI大模型应用架构的演进新范式,从传统的"基础设施-数据存储-大模型+RAG库-AI应用"模式,升级为增加"知识与能力中台"的五层架构。文章指出,企业不应仅停留在模型使用者层面,而应向系统构建者转变,通过构建知识图谱、业务规则库和能力抽象层,将散落的文档和业务规则升华为结构化知识和可复用能力,从而沉淀企业核心知识资产,在AI时代构建真正的核心竞争力。
2025-11-18 10:51:55
832
原创 【万字长文】为什么你的Prompt总失效?2025年大模型提示工程核心技巧:n8n+AI Agent!
本文探讨2025年AI提示工程从prompt到context的演进。分析Prompt失效原因,提出五大核心技巧:清晰具体指令、正向指令、Few-Shot学习、约束与上下文工程。介绍高级模式如Chain-of-Thought、RAG等,强调与模型共同生成Prompt的重要性,以及生产环境中的测试、错误处理和Token优化策略。
2025-11-18 10:50:03
805
原创 2026年AI人才趋势:大模型算法岗月薪5万,这些关键能力让你成为企业争夺的焦点!
2025年,随着DeepSeek等大模型技术的突破性发展,AI人才争夺战已超出传统边界,延伸至2026届高校毕业生招聘市场。最新发布的《2026届校招AI人才需求报告》描绘了一幅火热的图景:近60%的高科技企业已将AI人才纳入核心招聘目标,其创新驱动发展的特性决定了对AI人才的刚性需求。
2025-11-17 16:56:51
1873
原创 35+程序员的转型之路(2025):大模型时代下的职业重生指南!
2025年,大模型技术正重塑程序员职业版图。猎聘大数据显示,AI技术整体人才紧缺指数(TSI)达到了3.24,明确显示出人才市场处于高度供不应求的态势。而脉脉高聘报告指出,2025年1月至2月,大模型算法工程师平均月薪高达68,051元。
2025-11-17 16:52:45
998
原创 Gartner 2026十大技术趋势深度解析:AI全面引领未来,四大核心方向重塑企业IT架构!
Gartner发布的2026年十大技术趋势中,AI占据核心地位,分为架构师(基础设施)、合成者(AI应用)和先锋(安全治理)三组。其中,AI原生开发平台将重塑软件开发流程,多智能体系统实现AI协作,领域特定模型深入垂直行业,物理AI将智能带入实体世界。这些趋势正在发生,企业应选择最符合自身业务的1-2个方向深入布局,构建智能体能力、流程能力和平台能力,以在下一轮数字化竞争中领先。
2025-11-17 16:34:40
1088
原创 大模型4-bit量化技术揭秘:GPTQ、AWQ、QLoRA与FlatQuant,引领消费级设备上的AI革命!
文章详细介绍了大模型4-bit量化的前沿技术,重点分析了GPTQ、AWQ和QLoRA三种主流方法。GPTQ通过误差补偿实现精确量化,AWQ基于激活值保护关键权重,QLoRA结合4-bit量化与高效微调降低硬件门槛,FlatQuant学习最优变换实现全量化。这些方法在保持模型精度的同时,大幅降低显存需求,推动大模型在消费级设备上的应用。
2025-11-17 16:31:17
724
原创 【万字长文】LangGraph智能体设计模式实战:从提示链到多智能体协作!
本文详细介绍使用LangGraph框架实现的6种智能体设计模式:提示链、路由与并行化、反思、工具使用、规划及多智能体协作。通过代码示例展示如何构建稳健、灵活的AI系统,从简单任务分解到复杂多智能体协作,帮助开发者打造适合生产环境的AI工作流。
2025-11-17 16:28:57
930
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅