自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1709)
  • 收藏
  • 关注

原创 如何从传统产品经理转行成为顶尖的AI产品经理?终于有人一次性说清楚了!

我们先来看看大模型对于AI产品经理的定义:通过这个定义,我们可以发现,AI产品经理相较于传统产品经理而言,主要的差异其实就是在对AI技术的理解与应用上。大部分传统产品经理并没有硬性的要求一定要懂技术,主要工作的重点更加偏向于需求分析、业务理解、用户体验、产品设计、策略等方面,懂技术只是一个加分项。但对于AI产品经理,了解诸如大模型、机器学习、深度学习、自然语言处理、计算机视觉等AI相关的技术,则是一项必要条件,因为只有懂AI,才能利用AI满足需求,设计出AI产品的解决方案。

2024-09-19 11:07:30 1690 1

原创 花3000元自学AI大模型后,她薪水涨了20%

我看到了一个充满无限可能的新世界”,在面试完AI产品经理这一岗位后,陈漫在社交平台上如此描述自己的感受。AGI大模型浪潮席卷全球,技术革新越是凶猛,人们的失业焦虑便越加强烈。为了应对AI带来的冲击,有些人决定“打不过就加入”,转身投向这个风口行业。陈漫便是转行潮中的一员。如今在社交媒体搜索“转行AI”“AGI”等关键词,就会涌现大量转行经验的帖子。不少博主呼吁大家抓紧时间转行进入AI领域,“真心建议大家冲一冲AI赛道”“抓住AI红利”,此类标题反复出现。

2024-08-08 10:48:25 1789 1

原创 字节大厂大模型面经,看完手撕面试官,非常详细收藏我这一篇就够了

以下是一些大模型大厂的面经,供参考:谷歌(Google):面试形式:电话面试、在线编程测试、现场面试。面试内容:数据结构和算法、机器学习、深度学习、NLP、项目经验。面试难度:较高,注重基础知识和实际应用能力。亚马逊(Amazon):面试形式:电话面试、在线编程测试、现场面试。面试内容:数据结构和算法、机器学习、深度学习、NLP、项目经验。面试难度:较高,注重基础知识和实际应用能力。微软(Microsoft):面试形式:电话面试、在线编程测试、现场面试。

2024-07-31 16:35:33 1606 1

原创 全方位大模型教程:从基础入门到实战应用

2023年大西洋彼岸的OpenAi公司,AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,,包含🔻 压缩技术中,为什么量化要优于剪枝、蒸馏?🔻 如何搜索裁剪阈值用于裁剪outlier?🔻 包含有异常值outlier的特征如何量化?🔻 模型剪枝的技术背景🔻 模型剪枝具体方法🔻 模型剪枝前沿方法🔻 语言模型剪枝实例🔻 AI作画–以文生图🔻 扩散模型是什么🔻 扩散模型工作拓展🔻 扩散模型带来的机遇🔻 RLHF的优点和挑战🔻 RLHF如何改善大模型性能🔻 RLHF的实际应用案例。

2024-07-28 09:00:00 2068 1

原创 AI 大模型之美 | 更新完结

AI 大模型的美感不仅体现在其高科技的外表和复杂的内在结构上,更体现在它们带来的科技进步和社会变革中。它们是人类智慧和技术创新的结晶,不断推动着人类社会走向更加智能化和可持续的未来。如何学习AI大模型?我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。

2024-06-26 11:19:45 4902

原创 LLaMA-Factory大模型训练教程(附详细参数解析),一篇就够,建议收藏!大模型微调

本文详细介绍了LLaMA-Factory大模型训练平台的使用方法,包括安装配置、数据准备、模型下载、训练脚本编写与参数详解、训练过程监控及模型推理等完整流程。LLaMA-Factory提供完整中文文档和丰富示例,支持多种数据格式和训练方式,特别适合中文用户。文章通过实际案例展示如何使用DeepSpeed进行分布式训练,并详细解释各参数含义,帮助读者快速上手大模型微调任务。

2025-09-14 08:00:00 415

原创 大模型评估完全指南:从金融到医疗的四大行业场景评估方法!

本文探讨场景驱动的大模型评估方法论,强调行业场景实际表现更能反映模型商业价值。从金融、医疗、政务、教育四大行业出发,分析各行业特有的评估维度、挑战与实践方法:金融注重精度与合规,医疗强调准确与安全,政务关注政策解读与多语言适配,教育侧重个性化与记忆能力。未来评估将更依赖真实场景模拟与专家深度参与,确保模型"会用"且"用得放心"。

2025-09-14 07:00:00 899

原创 你是否适合学习AI?从核心能力到职业路径的全面解析!AI大模型学习路线路径+资源推荐,巨详细!!

《人工智能学习者的核心特质与成长路径》 人工智能学习需要兼具数学基础、编程能力与持续学习动力。数学方面,需掌握线性代数、概率统计及优化理论;编程则需精通Python及主流框架(TensorFlow/PyTorch)。成功案例显示,理工科背景(计算机/数学)及开发工程师转型更具优势。此外,兴趣驱动、跨学科整合能力(如AI+医疗/金融)及伦理意识同样关键。学习路径建议分三阶段:基础(数学/Python)、核心(机器学习/深度学习)、实战(Kaggle/开源项目)。行业数据显示,医疗AI工程师年薪达45万,量化研

2025-09-13 15:20:22 748

原创 Spring AI入门教程:零基础快速搭建AI项目,建议收藏学习!AI项目

本文详细介绍了如何利用Spring AI框架快速搭建AI项目。通过引入Spring AI核心模块和Ollama依赖,创建ChatClient和ChatModel实例,开发者可轻松实现与大模型的交互。文章展示了如何通过HTTP请求访问大模型,并演示了ChatClient支持多种返回数据类型的功能,为Java开发者提供了进入AI领域的便捷途径。

2025-09-13 15:13:40 434

原创 阿里千问团队又又又又要开源新模型:阿里新一代Qwen3-Next深度解析!

继阿里昨天刚发布Qwen3-ASR模型之后,Qwen团队又在社区提交了全新的Qwen3-Next代码。这意味着阿里即将开源Qwen3家族的新成员。这个模型最大的特点是架构变化很大,与此前Qwen系列很不一样。目前,该模型还未正式开源或者发布,我们是从阿里提交的一个介绍文本获取的信息,供大家参考。

2025-09-13 15:02:43 796

原创 2025届毕业生注意:明年就业市场竞争激烈,提前规划,避免求职陷阱!

近日,教育部公布,2025届全国普通高校毕业生规模预计达1222万人,同比增加43万人。这意味着我国高校毕业生数量首次突破1200万大关,创下近十年的新高。如今2024年的1179万大学毕业生,就业市场还未完全消化,根据智联招聘发布的报告,2024年高校毕业生的就业率仅为55%,也就是说有接近一半的大学毕业生处于待业状态。这意味着明年的大学毕业生的就业形势会日益严峻。

2025-09-12 16:12:23 618

原创 非技术背景|AIGC产品经理转型宝典:从传统PM到大模型产品经理的跃迁之路!

文章对比了AIGC产品经理与传统产品经理的异同,介绍了AIGC概念及其发展历程,分析了产品经理在需求收集和产品设计方面的差异变化。文章详细解读了AIGC产品岗的三类对标公司,并提供了跨界转型的四步法:定目标、速执行、频复盘、强迭代,为非技术背景的产品人员提供了实用转型路径。

2025-09-12 13:59:58 683

原创 国内AI企业DeepSeek计划年底发布对标OpenAI的AI Agent(建议收藏)

国内AI企业DeepSeek计划年底发布对标OpenAI的AI Agent,能自主执行多步任务并自我学习优化。同时,Kimi增强了编码能力和上下文长度,Qwen也在开发类似功能。尽管Anthropic禁止中国资本使用Claude,但DeepSeek、Qwen、Kimi等国内AI模型正迅速崛起,技术实力不断增强,为开发者提供了更多实践机会。

2025-09-12 13:56:51 386

原创 企业级Agent架构最佳实践:MCP中间层设计与实现,代码可直接收藏!

文章介绍使用MCP(Model Context Protocol)作为中间层解决企业级Agent架构中的扩展性问题。通过将Agent与工具解耦,MCP提供统一接口、安全控制和更好的扩展性。文章以Google ADK框架为例,展示如何使用FastMCP创建MCP Server提供文件系统访问能力,并构建Agent作为MCP Client调用这些服务。这种架构有效解决了直接使用LLM Function Calling方式带来的工具接口异构、安全管控缺失和扩展性差等问题。

2025-09-12 10:26:11 803

原创 一文搞懂RAG重排技术:提升检索质量的4大策略与实战代码!

本文详解RAG系统检索后优化策略,重点介绍四种重排技术:RRF、Cross-Encoder、ColBERT和基于LLM的重排。分析各技术优缺点及适用场景,提出分层管道整合方法,在成本、延迟和精度间取得平衡。通过组合不同技术,可显著提升检索结果质量,优化RAG系统性能。文章提供完整代码示例,助力开发者实践应用。

2025-09-12 10:16:27 634

原创 大模型算法工程师面试题,(非常详细)收藏这一篇就够了!大模型面试题+答案!

本文详解RAG系统文档预处理技术,重点讲解PDF文档中文字、表格和图片的提取方法。深入解析MCP协议工作机制、与Function call的区别及适用场景,为构建大模型应用提供实用技术指导。

2025-09-11 14:10:53 640

原创 【金九银十】从12K到20K+:程序员如何转岗AI产品经理,实现薪资翻倍!

李雷(化名)做技术4年,从后端开发→全栈开发→偏业务的开发,在今年年初被裁员了。找工作2个月无果后,一怒之下我转岗了产品经理。结果涨薪了60%,拿到入职20K+的产品新offer!

2025-09-11 14:03:38 894

原创 阿里云Qwen团队推出Qwen3-ASR:一个模型搞定多语言+抗噪+专业词汇识别!

阿里云Qwen团队推出的Qwen3-ASR Flash采用统一模型架构,支持11种语言自动识别,无需用户选择。通过上下文注入机制提升专业词汇识别率,在嘈杂环境中保持8%以下词错误率。该系统简化部署运维,降低集成成本,适用于教育、媒体、客服等多场景,标志着语音识别从"单点突破"走向"通用智能"的新时代。

2025-09-11 11:10:15 522

原创 小白友好:LangChain&LangGraph智能体开发实战+LangSmith调试指南!

文章详细介绍了使用LangChain、LangGraph和LangSmith开发AI智能体的实战教程。从基础概念出发,通过Cursor创建项目并实现智能体功能,使用LangSmith进行调试和追踪,最后通过agent-chat构建UI界面。内容涵盖环境配置、代码生成、调试流程等完整开发步骤,为读者提供清晰的学习路径和实践指导。

2025-09-11 10:58:54 915

原创 AI大语言模型发展历程:从ELIZA到GPT-4,AI如何改变程序员的工作与生活!

大语言模型(LLMs)是AI从"专用工具"向"通用智能体"演进的关键里程碑。文章系统梳理其四阶段发展:萌芽期(规则套话)、奠基期(深度学习)、暴发期(GPT系列)及未来趋势(多模态、小型化、Agent化)。大模型通过Transformer架构和海量预训练,解决了"语言通用表示"问题,实现从被动回答到主动做事的质变。它重新定义了人与机器的关系,大幅提升工作效率,降低专业服务门槛,成为数字化社会的核心操作系统。

2025-09-11 10:56:05 581

原创 【保姆级教程】2025年最新最全,AI算法工程师学习路线图,从入门到精通,超详细!

从入门到进阶,系统梳理成为一名 AI 算法工程师所需掌握的知识、工具、项目、证书与资源,适合高校学生、转行人员和在岗工程师。

2025-09-10 14:45:57 1222

原创 AGI深度解析!大模型是否值得你投身其中?一文带你全面了解定义、应用与未来就业前景!

通用人工智能(AGI)是指具备跨领域学习、推理与决策能力的人工智能系统,其核心目标是模拟人类的全域认知能力。与仅能处理单一任务的窄AI不同,AGI需**自主适应复杂环境**,整合文本、图像、声音等多模态信息进行综合判断。

2025-09-10 14:29:03 1051

原创 【技术干货】阿里Qwen3-Max大模型评测:万亿参数如何改变企业级AI应用?值得收藏!

阿里巴巴推出Qwen3-Max Preview Instruct,首个超1万亿参数大模型,与行业"轻量化"趋势相反。该模型具备深度推理、多语言支持、超长上下文和企业级应用能力,可降低Prompt工程成本,支持复杂长上下文工作流和Agent应用。适用于企业Copilot、数据分析、开发工具链等场景,标志着大模型竞争进入"超大规模"与"轻量化"并存的新阶段。

2025-09-10 11:37:08 580

原创 GitHub上1.6_万点赞!Claude Code 桌面指挥中心 opcode:让 AI 编程体验提升一个档次!

opcode 是一个为 Claude Code 量身打造的图形化桌面应用工具箱,提供项目管理、AI 小助手创建、API 花费监控、代码会话检查点管理和 MCP 服务配置等功能。它解决了命令行使用 Claude Code 时的繁琐问题,使 AI 编程体验更加直观、高效和可控。作为开源项目,它让开发者能够更便捷地利用 Claude 模型进行编程工作。

2025-09-10 11:33:53 668

原创 大模型基础:从零实现多头自注意力机制,大模型核心组件深度解析!

本文详解多头自注意力机制,这是Transformer和大语言模型的核心组件。文章先通过堆叠单头注意力层实现,然后提出更高效的权重分割方法:通过张量重塑和转置将输入分割为多个独立处理的注意力头,最后合并结果并添加输出投影层。相比简单堆叠,这种方法大幅提高计算效率,是现代大语言模型处理复杂模式的关键技术。

2025-09-10 11:30:56 936

原创 未来5年真正值钱的程序员,都是懂大模型原理的程序员!传统程序员转型AI大模型超详细学习路线!!

兄弟们!现在用Cursor写代码确实爽,但你知道这玩意其实是慢性毒药吗?当编程变得和用Word一样简单,老板还需要花钱雇你写CRUD吗?未来5年真正值钱的程序员,都是懂大模型原理的程序员!

2025-09-09 16:06:19 1322

原创 为什么程序员有35岁危机?大龄程序员的出路在哪?

在互联网领域,说到35岁,总是和大厂,裁员,淘汰,危机等词捆绑在一起。“35岁危机”从何而来?追根溯源,我发现这个词来自一些媒体的过度炒作。过去10-15年,国内互联网公司快速崛起,很多app成了炙手可热的国民应用。正因为这些厂名气大起薪高,媒体喜欢从它们身上寻找话题,获取更多流量和热点。

2025-09-09 16:01:00 771

原创 大模型Agent长记忆机制学术研究解读(2024-2025)

本文综述了2024-2025年大模型Agent长记忆机制的研究进展,分析了其在维持对话连贯性、支持复杂任务执行和实现持续学习方面的必要性及挑战。文章系统梳理了记忆表示、检索、更新等关键技术的学术创新,特别是基于图的记忆架构、数据分析与对话Agent中的具体应用。研究趋势指向多模态记忆、结构化知识、动态管理和效率优化,为构建智能自适应的Agent提供理论基础。

2025-09-09 09:42:49 823

原创 【干货收藏】Dify私有化部署实战:构建企业内部安全AI应用开发平台!大模型部署

文章详解如何通过私有化部署开源LLM平台Dify,构建企业内部安全AI应用。涵盖私有化部署优势(数据安全、模型可控、网络隔离)、基于Docker Compose的完整部署步骤,以及通过工作流设计器快速构建企业级AI应用的方法。以智能IT客服工单分类为例,展示拖拽式工作流设计,让非技术人员也能参与AI应用构建,实现企业智能化转型。

2025-09-09 09:40:38 841

原创 大语言模型(LLM)纠错新法:模型编辑技术,精准修正偏见与错误!

本文介绍了大语言模型存在的偏见、毒性和知识错误问题,以及传统修正方法的局限性。重点阐述了模型编辑技术,一种通过局部修改模型参数来纠正错误的新方法。文章详细分析了模型编辑的五大关键性质(准确性、泛化性、可迁移性、局部性和高效性),并介绍了外部拓展法和内部修改法两大类实现方法。模型编辑技术能够高效精准地修正模型错误,同时保持原有能力,是解决大语言模型问题的重要方向。

2025-09-09 09:39:20 733

原创 【2025最新】AI大模型工程师学习路线图:大模型的学习顺序一定不要搞错了,正确的学习流程能让你事半功倍!

“学习是一个从围观到宏观,从宏观到微观的一个过程 ”学习大模型技术也有几个月的时间了,之前的学习一直是东一榔头,西一棒槌,这学一点那学一点,虽然弄的乱七八糟,但对大模型技术也算有了一个初步的认识。因此,今天就来整体梳理一下大模型技术的框架,争取从大模型所涉及的理论,技术,应用等多个方面对大模型进行梳理。

2025-09-08 16:44:03 1420

原创 【秋招必刷】25道大模型算法面试:从Transformer到实际应用,助你拿下30W年薪offer!

本文是一份全面的大模型学习指南,涵盖了Transformer架构详解、位置编码技术、LayerNorm与BatchNorm区别等核心知识;介绍了大模型开发的六大核心技术,包括Prompt工程、函数调用、RAG检索增强、Agent智能体等;详细讲解了模型量化、蒸馏、剪枝等优化方法,以及梯度问题处理、性能评估指标等实用内容;最后探讨了数据并行与模型并行技术,为学习者提供从理论到实践的完整知识体系,助力面试准备与实际项目开发。

2025-09-08 13:28:36 697

原创 一文搞懂大模型:拆解大模型Agent技能层级:面试官到底在考察什么?

本文详细解析了大模型Agent的四个能力层级(概念理解、技术应用、系统优化、架构设计),明确各层级"深入理解"的标准,并介绍面试官如何通过理论考察、实践经验、系统设计等方面判断候选人能力深度。同时提供学习资源推荐,强调工程思维是AI Agent时代保持竞争力的核心能力。

2025-09-08 11:55:00 1003

原创 【保姆级教程】构建企业级AI智能客服:大模型应用实践与技术方案详解!

本文分享了企业AI智能客服系统的建设实践,针对传统客服人工压力大、知识管理混乱等问题,提出基于大模型的解决方案。通过中心路由Agent分发用户意图,专项Agent调用知识库和业务系统实现智能回复。该方案已应用于企业微信群,准确率达80%以上,实现简单且成本低。文章详细介绍了业务流程、功能架构和技术方案,为企业构建AI客服提供了实用参考。

2025-09-08 11:49:23 913

原创 大模型应用开发必看:从快速实现到优质产品的挑战与对策,从入门到精通,收藏这篇就够了!

文章探讨了大模型应用从简单实现到优质产品的巨大差距。作者通过项目经验指出,功能实现虽快,但优化使其稳定可靠却需长期努力。核心挑战在于模型稳定性问题,特别是在文档处理和数据召回环节。文章详细分析了RAG技术的应用难点,探讨了通过文档优化、问题重写和Agent智能体技术提升系统性能的方法,强调了高质量大模型应用需要深入理解技术细节和持续优化。

2025-09-08 11:47:55 811

原创 【保姆级教程】从零开始构建大模型基础设施:Kubernetes+Ray+PyTorch+vLLM实战指南!

文章介绍了AI计算领域的流行开源技术栈Kubernetes+Ray+PyTorch+vLLM,详细解析了其三层架构:训练与推理框架、分布式计算引擎和容器编排器。通过Pinterest、Uber、Roblox等公司的实际案例,展示了该技术栈在模型训练、推理和后训练等场景的应用,强调了其在处理大规模AI工作负载时的优势,以及如何满足扩展性、迭代速度和未来适应性等核心需求。

2025-09-06 08:00:00 863

原创 大模型应用开发上线之前要注意些什么?编码Agent+MCP实战:打造智能测试流水线,解决开发上线痛点!!

本文详解如何通过编码Agent+MCP构建测试闭环流水线,解决用例滞后、执行割裂等痛点。从代码变更信号采集,到用例自动生成、智能执行、评估决策,形成完整闭环。实施后可显著缩短验证时间、降低回归成本、减少线上故障,提供90天分阶段落地路线图,帮助团队实现测试自动化,让发布不再靠运气。

2025-09-06 07:00:00 255

原创 对于99%的普通人来说,AI这时代红利很难吃到蛋糕尖,我们能做的只能是不被拍在沙滩上!!

AI时代是认知分层加速赛,普通人面临速度、资本与认知三重高墙。应放弃"淘金梦",成为"冲浪者",通过拥抱AI增强型职业定位、深耕行业知识壁垒、培养AI素养,将AI作为副驾驶而非竞争对手。未来,"会用AI的人,取代不会用AI的人"。

2025-09-05 13:35:43 892

原创 【干货收藏】大模型企业应用三大类型揭秘:智能问答在制造业的实战案例解析!大模型应用

本文详细介绍了大模型在企业智能问答中的应用,以制造业设备维修助手为例,阐述了技术架构与三大核心挑战的解决方案,强调了知识库构建与维护的重要性,以及制造业应用中答案可追溯性和准确性的关键作用。

2025-09-05 11:47:02 752

原创 大模型应用开发必备:一文看懂检索增强生成(RAG)的那些事儿!!

文章详细介绍了检索增强生成(RAG)技术,这是一种解决大模型领域知识差距、事实问题和幻觉等挑战的方法。从RAG的基本概念、工作流程、不同范式(原生RAG、高级RAG、模块化RAG)到框架组件(检索、生成、增强)进行了深入解析,比较了RAG与微调的优缺点和适用场景,讨论了评估方法和挑战,并介绍了相关工具。RAG通过为LLM添加外部知识库,使其能够获取最新信息,减少幻觉,提高回答的准确性和相关性。

2025-09-05 11:42:35 813

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除