- 博客(2045)
- 收藏
- 关注
原创 100道高频大模型面试题,看我是如何手撕面试官 脚踢hr
提供一百道面试题并保证每一道题目的详细解答达到一千字是不太现实的,因为这将会是一个非常庞大的文档。不过,我可以为你提供一系列精心挑选的大模型相关面试题目,并简要说明每个问题的重点和考察方向,这样可以帮助你准备面试。大模型面试题集总结以上这些面试题目涵盖了从基础概念到高级技术的各个方面,对于准备大模型相关职位的面试非常有帮助。建议在准备过程中,不仅要熟悉这些问题的答案,还要尝试自己动手实践,这样才能真正掌握所学知识。希望这份面试题集能帮助你在面试中脱颖而出!
2024-08-16 16:06:29
1683
1
原创 跨越边界:我在转型AI产品经理的一年里所积累的成长与感悟
不知不觉,已经挂着AI产品经理的title过了一年多,盘点后竟然发现,这一年中居然从0到1做了4款AI应用产品,涉及内容、营销销售、私域运营等方向,忙碌而充实。今天就结合自己这一年多的AI转型实践,和大家分享下我关于AI产品经理的一些总结和思考。在这一年多的转型旅程中,我从一名传统产品经理成长为AI产品经理,这个过程充满了挑战与收获:知识体系的重构我系统地学习了机器学习、深度学习、自然语言处理等AI基础课程,弥补了技术知识的空白。
2024-08-02 18:07:37
2417
1
原创 深入探究文档解析技术,助力大模型训练与应用的创新发展
探索文档解析技术是推动大模型训练与应用的重要一环。随着信息的爆炸式增长,文档数据成为了重要的数据来源之一,这些数据以多种形式存在,包括结构化数据、非结构化文本和图像等。因此,有效地解析和理解这些文档数据对于提升大模型性能与拓展大模型应用至关重要。在此背景下,大模型训练与应用需要依赖先进的文档解析技术来处理复杂的文档数据。
2024-07-19 11:41:07
2284
1
原创 初识LangChain的快速入门指南
LangServe可以帮助开发人员将LangChain应用程序部署为REST API。使用LangChain时不是必定使用LangServe。安装langserve。
2024-06-29 20:56:14
1845
1
原创 从零开始认识大模型,入行必读!
大模型,顾名思义,就是具有庞大参数和复杂结构的机器学习模型。它能够处理海量的数据,从中提取出有价值的信息,为我们提供决策支持。与传统的机器学习模型相比,大模型具有更高的准确性、更强的泛化能力和更广泛的应用场景。
2024-06-24 13:47:24
2243
1
原创 Java程序员的新出路:突破传统开发天花板,抓住大模型应用开发红利期的破局之路!
Java作为企业级应用开发的基石语言,拥有庞大的开发者社区和成熟的生态系统。Java程序员普遍具备严谨的编程习惯、良好的面向对象设计能力和丰富的系统集成经验。这些特质在大模型应用开发中同样至关重要。大模型并非孤立存在,而是需要与现有系统(如数据库、微服务、消息队列等)深度集成,构建端到端的智能解决方案。Java程序员在Spring Boot、微服务架构(如Spring Cloud)、分布式系统设计等方面的经验,使其在构建稳定、可扩展的大模型后端服务时游刃有余。
2025-11-24 16:27:08
1320
原创 大模型应用开发入门「保姆级地图」:从核心分类到实战选型,看这篇就够了!
模型微调的基本思想是使用少量带标签的数据对预训练模型进行再次训练,以适应特定任务。在这个过程中,模型的参数会根据新的数据分布进行调整。这种方法的好处在于,它利用了预训练模型的强大能力,同时还能够适应新的数据分布。因此,模型微调能够提高模型的泛化能力,减少过拟合现象。
2025-11-24 16:18:41
503
原创 RAG知识库的血泪教训:爬过这十大坑,准确率飙升90%!避坑与优化指南一次性讲透!
文章系统解析了RAG知识库构建中的十大典型误区,包括数据质量忽视、检索策略不当、文本拆分粗放等问题,并提供了针对性的优化技巧。通过高质量数据治理、场景化检索优化、生成约束强化和科学评估体系构建,帮助RAG系统从"能用"升级为"好用",实现精准连接知识与需求的核心价值。
2025-11-24 15:27:20
426
原创 让AI智能体“记忆力”暴增的秘籍!上下文工程内部技术首次公开,高效处理长周期任务的必备指南!
上下文工程是构建高效AI智能体的关键方法论,针对大模型的上下文衰减和注意力预算限制。核心策略是使用最少但信息量高的token,采用即时上下文检索、压缩和结构化笔记等技术应对长周期任务。文章详细介绍了高效上下文的结构、上下文检索与自主智能检索方法,以及应对上下文污染的技术,帮助开发者构建更强大、更高效的AI智能体。
2025-11-24 15:21:17
327
原创 2025年最全「AI智能体协议全景图」发布,一站式搞定底层架构,任你挑选!
本文介绍了AI智能体领域的三大核心协议:AG-UI负责智能体前后端交互,MCP实现工具与工作流程的统一对接,A2A规范多智能体协作机制。这三大协议分层配合而非互斥,CopilotKit作为开源工具简化了基于这些协议的智能体应用开发,提供自动界面生成和生产级基础设施。文章还提供了《智能体协议全景图》PDF,帮助开发者从零开始构建智能体应用。
2025-11-24 15:18:29
376
原创 程序员必备技能:上下文工程,AI与团队效率爆发的秘密武器!
本文探讨了上下文工程在AI和团队管理中的核心价值。指出无论是与AI交互还是领导团队,提供充分上下文(包括任务目的、受众、边界和成功标准)远比简单指令更有效。管理者应成为"上下文架构师"而非简单的"提示词工程师",通过构建信息场域激活团队潜能。评判领导者是否值得追随的关键标准是能否提供完整决策上下文,因为上下文是集体智能的放大器,能显著提升组织效率和创新能力。
2025-11-23 07:15:00
757
原创 大模型应用实战指南:从业务需求到高效部署,实际业务场景下的大模型应用实践指南!
文章详细介绍了大模型从开发到实际业务场景部署的完整流程,包括业务需求分析(功能性/非功能性需求)、性能优化(加速处理、减少计算量)、用户感知优化(流式输出、错误处理)及稳定性保障(自动扩缩容、监控预警)。核心思想是在业务需求与技术实现间寻求平衡,实现大模型应用的高效、低成本部署与稳定运行。
2025-11-23 07:00:00
923
原创 大模型入门到精通:零基础详细教程,六大部分系统化学习指南,AI大模型学习不再迷茫!
作者分享了自己学习AI大模型的经历,并整理了一个系统化的六部分学习框架,包括深度学习基础知识、自然语言处理基础知识、大语言模型基础知识、大语言模型推理、大语言模型应用以及大语言模型前沿。每个部分都有明确的难度标识和具体学习内容,旨在帮助学习者有目的地构建大模型知识体系,避免走弯路,节省学习时间。
2025-11-22 13:33:44
955
原创 AI时代最强CP:知识图谱与大语言模型,揭秘它们如何重塑未来信息检索与数据价值!
在这个人工智能快速发展的时代,一场深刻的技术革命正在悄然展开。正如知识图谱架构师Tony Seale所观察到的,“在大语言模型真正进入大众视野之前,一场重大变革就已经在酝酿中了,这场AI革命正在慢慢渗透到公众意识中。但我们仍然只是处于这个指数增长曲线的起始阶段。”这场技术革命的意义堪比历史上的农业革命和工业革命。然而,在这个变革过程中,一个令人担忧的问题浮现出来:我们是否会失去企业生态系统的多样性?
2025-11-22 11:59:58
589
原创 Google上下文工程(Context Engineering)技术揭秘:从零构建大模型长期记忆系统!
本文介绍Google提出的上下文工程技术,通过会话(临时工作台)和内存(长期存储)两大组件解决大模型无法长期记忆的问题。详细阐述了会话压缩策略、内存生成与整合机制、检索策略及生产环境中的安全隐私考量,帮助开发者构建能够记住用户偏好、提供个性化体验的智能AI代理,使大模型从简单对话工具转变为真正的个人助手。
2025-11-22 10:57:17
997
原创 从入门到上头:我花了72小时,总结出这份LLM零基础速成攻略(附学习路径)
个人补充下,Transformer相关的知识包括深度学习基础,循环神经网络基础(RNN,LSTM,GRU),如今新式的改进层出不穷,科研党则需要紧跟新模型如:KAN,Mamba等,了解Transformer前后发展。
2025-11-21 15:22:49
1123
原创 生产级AI系统五层技术栈全解析:从基础设施到应用,打造完整解决方案!
本文提出生产级AI系统的五层架构模型,将复杂度合理分层,实现独立优化和灵活替换。从基础设施到应用层,系统分析了各层技术选型、部署策略和最佳实践,解决了传统架构不适用于AI系统的问题。理解这一完整技术栈是构建可靠、可控、可扩展的企业级AI应用的关键,避免87%的AI项目无法成功进入生产环境的困境。
2025-11-21 15:11:30
793
原创 看完《LangChain入门指南》,从零开始,成为LLM应用大师!
是由LangChain中文网联合创始人编著的LLM应用开发入门书籍,全书共11章。前两章介绍LLM技术背景和LangChain设计理念,中间章节详细拆解6大核心模块(模型I/O、数据增强、链、记忆等)并配代码示例,第9章通过PDF问答程序实战案例巩固知识,第10章讲解集成应用拓展场景,最后一章解析Transformer等基础理论夯实技术基础,适合初学者系统学习。
2025-11-21 15:07:05
879
原创 vLLM中自定义CUDA算子开发全攻略:从PyTorch到Triton,性能提升3倍的秘密!
本文详细介绍了在vLLM中开发自定义CUDA算子(merge_attention_states)的完整流程,从PyTorch实现到Triton基础算子,再到CUDA优化。通过向量化内存访问等技术,实现了比Triton版本高3倍的性能提升。文章涵盖了算子开发的全过程,包括Dispatch逻辑、PyTorch binding、单元测试和性能评估,最终开发的CUDA算子已被成功合入vLLM项目,为开发者提供了实用的算子开发指南。
2025-11-21 15:04:04
739
原创 大模型新方向!商汤办公小浣熊AI Agent实战:从数据分析到专业PPT一键生成!
商汤"办公小浣熊"AI Agent通过数据分析、深度研究和PPT生成三个场景,展现了其强大的垂直场景解决能力。该工具具备交互式、可调整、可追溯的特点,能规划、执行、深度思考,生成结构清晰的专业内容。从论文分析到可视化图表,再到一键生成可编辑PPT,它提供了端到端的办公解决方案,是AI Agent落地的优秀实践。
2025-11-21 15:02:36
610
原创 美团大模型算法面试宝典:二面基础问题全解析,助你一臂之力踏入AI行业巨头!
想招人,网上找了一些面试题。结果发现,有的东西我自己都叫不准。 这就尴尬了,赶快充电一波。这是网上找的美团的问题。解答是我在大模型生成结果上校验、修改出来的。
2025-11-20 16:04:04
906
原创 普通程序员转型AI大模型:是机遇还是挑战?一篇文章为你揭秘2025年最火就业趋势!
在程序员圈子中,技术转型近年来一直是热门话题。随着AI技术的迅猛发展,优秀人才短缺,程序员向AI大模型转型似乎成为了一条通往职场先机的路径。但是,这条转型之路是否容易走,成功率又如何呢?作为一个普通的程序员,到底应不应该转型AI大模型?
2025-11-20 15:52:01
871
原创 大模型轻量化实战:从235B到32B的模型蒸馏与微调技术详解!
文章分享了在大模型应用中,为解决235B大模型处理性能弱的问题,采用知识蒸馏技术将大模型知识迁移到32B小模型的实践。通过"教师-学生"架构,先用大模型处理样本,再用结果微调小模型,使小模型具备大模型思路但仅适用于特定场景。同时区分了模型微调(需结合基模部署)与知识蒸馏(可独立部署)的不同,并指出微调本质是冻结大部分原始参数,通过训练额外小参数来扩展或替换模型层。
2025-11-20 15:47:55
916
原创 2025 Agent元年:大模型能力层级与通用智能体距离分析!
本文分析了2025年被称为"Agent元年"的大模型Agent能力层级。研究团队通过客服场景测试发现,即使是领先的GPT-5和Claude模型,也有超过40%的任务失败。模型能力分为基础能力、适应性、忠实度和常识推理四个层级,其中常识推理是实现通用智能体的最后障碍。2025年是RL环境之年,模型在虚拟环境中学习和行动,但通用智能体仍需时日。
2025-11-20 15:46:44
582
原创 自然语言处理(NLP)基础概念详解:从入门到大模型应用指南!
文章系统介绍了自然语言处理(NLP)的基础概念、层级结构、自然语言生成和应用场景,重点阐述了深度学习如何革新NLP领域。从传统浅层模型到基于词嵌入的神经网络,文章详细梳理了CNN、RNN等核心模型及注意力机制等技术演进,展示了NLP从规则驱动到数据驱动的发展历程,为理解大模型在语言处理中的应用奠定了基础。
2025-11-20 15:28:55
1011
原创 大语言模型(LLM)从入门到精通!零基础详细教程,一篇搞定核心知识,赶紧收藏!
自2018年起,全球科技巨头与科研机构纷纷投身这一领域:Google推出BERT、OpenAI发布GPT系列、Meta研发LLaMA,国内百度的ERNIE、华为的盘古大模型也相继亮相[1][6]。2022年11月,OpenAI的ChatGPT(Chat Generative Pre-trained Transformer)横空出世,凭借自然流畅的对话能力引发全球关注,让用户得以通过日常语言实现问答、翻译、创作等多样化任务——从理解复杂文本到生成创意内容,LLMs展现出对世界知识的广泛掌握与对人类语言的深度理
2025-11-19 16:20:05
1070
原创 ReAct与Reflexion框架:大模型提示技术入门到精通,程序员必学!
文章介绍了ReAct和Reflexion两种提升大语言模型能力的关键提示技术框架。ReAct结合推理与行动,使模型能够与外部环境交互,减少幻觉;Reflexion则在此基础上增加评估和反思机制,形成完整学习闭环。两者结合可显著提升模型在知识密集型、决策型和编程任务上的表现,为解决大模型事实幻觉、缺乏实时信息、规划能力不足等问题提供了有效方案。
2025-11-19 16:11:20
1024
原创 OPPO创新!ReSpec框架让大语言模型推理加速33%,效率和质量两不误!
ReSpec是OPPO研究院提出的一种混合推测解码框架,通过熵引导自适应触发机制、反馈驱动的候选选择机制和来源感知的宽松验证策略,实现大语言模型的高效推理加速。实验表明,在Spec-Bench基准上,ReSpec相比EAGLE-2和SAM-Decoding分别提升超过33%和25%的加速效果,同时保持输出质量不变,为LLM推理加速提供了更智能、高效的新范式。
2025-11-19 16:09:55
782
原创 算法岗和开发岗有什么区别?算法VS开发全方位对比:大模型时代程序员的职业选择指南!
文章对比了算法岗与开发岗的核心区别:开发岗主要负责功能实现,工作明确,多"身体累";算法岗侧重指标优化,不确定性大,多"心累"。算法岗要求数学能力强,开发岗强调逻辑思维。当前两者薪资趋同,但算法内卷更严重。无论选择哪个方向,持续学习紧跟技术趋势都至关重要。
2025-11-19 16:08:13
606
原创 段永平预言:10年后哪些AI大模型能生存?揭秘未来赢家!
段永平看好Gemini成为未来存活的主流大模型。Google在AI领域觉醒后,凭借其生态资源、技术实力(发明Transformer模型)及用户友好策略,使Gemini快速崛起。其Deep Research和Nano Banana等产品表现出色,作者认为Gemini有望在大模型领域跻身前三。
2025-11-19 16:06:40
716
原创 大模型时代AI岗位全解析:算法研究到Agent开发,大厂JD数据与就业方向一网打尽!
近两年来,大模型技术如同一场汹涌的浪潮,席卷了整个科技领域,热度始终居高不下。在这股浪潮的推动下,科技圈掀起了一股“跨界内卷”热潮——无论是深耕传统软件开发的Java工程师、C++工程师,专注用户界面搭建的前端开发者,还是擅长数据挖掘与分析的数据分析师、搭建系统骨架的架构师,纷纷将目光投向大模型领域,希望在这片新蓝海中找到职业突破的机会。
2025-11-18 11:24:57
1845
原创 AI大模型井喷时代,普通大学生如何破局?这四大方向让你成为企业争抢的AI人才!
2025年,AI对就业市场的冲击已从理论走向现实。美国斯坦福大学研究指出,软件研发领域22~25岁就业人数较2022年高峰期减少20%。生成代码、客服咨询等体系化知识工作正迅速被AI替代。
2025-11-18 11:22:48
740
原创 AI智能体框架大比拼:Dify、Coze、n8n等六款热门框架特点、优缺点及选型指南!
文章详细介绍了六款热门AI智能体框架:Dify、Coze、n8n、AutoGen、LangChain和CrewAI,按难度分为低代码平台、通用开发框架和多智能体协作框架三类。文章分析了各框架的特点、优缺点及适用场景,并提供了横向对比和选型指南,帮助不同技术背景的开发者选择合适的框架,快速上手AI智能体开发。
2025-11-18 11:19:07
914
原创 【大模型本地部署】vLLM×魔搭社区教程:一文学会在Windows上本地部署大模型!
摘要 本文详细介绍了如何在Windows系统上通过WSL2部署vLLM框架来运行大模型。由于vLLM不支持原生Windows,需要借助WSL2(最新版Linux子系统)实现。安装前需确保系统版本符合要求(较新的Win10/Win11),并开启"虚拟机平台"等必要功能。重点步骤包括:安装Ubuntu发行版、配置国内软件源、验证显卡驱动、创建Python虚拟环境、使用uv工具安装vLLM和魔搭社区库。最后演示了通过Python脚本下载模型并编写启动脚本运行vLLM服务的方法,提供了关键参数说
2025-11-18 11:17:28
812
原创 【大模型面试】淘宝二面:如何让Agent的函数调用既准确又稳定?
这个问题乍一看是“实现细节”,但实际上,面试官真正想听的是:有没有完整的端到端体系,而不是停留在框架 demo 那种层面。很多人回答,“我们用了 OpenAI 的 function calling,让模型自己选工具”, 这种回答最多算 40 分。
2025-11-18 11:15:40
739
原创 从煤矿到AI,38岁转行者的逆袭之路:年入翻倍,他们如何做到的?
2025年全球人工智能市场规模预计突破3.6万亿美元,较2015年增长近30倍。中国作为全球第二大AI市场,2025年核心产业规模预计超5000亿元。爆炸式增长的背后,是巨大的人才缺口——中国2025年AI人才需求预计600万人,缺口超400万。
2025-11-17 15:52:44
762
原创 2026校招揭秘:AI大模型工程师月薪2.5万!数学能力成新货币,你能否抓住机遇?
本文指出2026届校招市场AI人才需求呈现"需求稳增、结构优化、薪酬分化"特征。高科技企业成为AI人才需求主力军,技术研发类岗位需求旺盛。企业招聘标准发生变革,数学与算法基础、实际项目经验成为核心评估指标,名校学历重要性下降。大模型算法工程师月薪中位数近2.5万,领跑校招市场,凸显行业对高端技术人才的重视。具备扎实算法基础和项目经验的AI人才将成最大赢家。
2025-11-17 15:43:22
1425
原创 LangChain 1.0 & LangSmith Studio Text2SQL实战指南:从零构建大模型应用!
LangChain 1.0通过品牌整合解决了早期命名混乱和工具链割裂问题,明确各组件定位。LangSmith Studio作为可视化调试平台,使大模型行为"看得见、调得动",支持实时查看Agent决策过程。文章详细介绍本地启动LangSmith Studio步骤,并在Text2SQL场景下展示实战调试效果,为开发者构建可靠智能体提供完整工程闭环。
2025-11-17 15:37:02
649
原创 大模型未来演进揭秘:世界模型三大技术路线全解析,程序员必备!
AI三巨头李飞飞、LeCun、谷歌分别推出不同技术路线的世界模型:Marble专注3D环境生成,JEPA注重抽象表征和物理预测,Genie 3生成可交互视频环境。三者构成"世界模型金字塔",从界面到认知框架,越抽象越适合AI训练。这三种范式分别回答"世界长什么样"、"世界怎么变"和"世界的结构是什么",为AI发展提供了不同视角,是理解大模型未来演进的重要参考。
2025-11-17 15:35:30
606
原创 大模型Agent记忆架构:如何借鉴人类遗忘机制优化系统性能!
文章探讨了AI Agent记忆系统设计,借鉴DeepSeek OCR论文中用光学压缩模拟人类遗忘机制的思路。指出无限扩展上下文窗口成本高昂且效率低下,提出应像人类一样实施分层记忆和自然遗忘:近期对话保留高分辨率,远期信息逐渐压缩。这种选择性保留策略能显著降低计算成本,避免信息过载,同时保持Agent的长期记忆能力,在资源有限的情况下实现更智能的决策。
2025-11-17 15:30:54
697
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅