AI大模型入门教程-优快云博客

原创投资人呼叫AI产品经理

互联网产品经理可能是时候跳出来说话了，因为过去两年基本都是技术在说话。在最近一个AI圆桌论坛上，其中一位投资人说了这样一句话。这是一个有关时间节点的判断，背后暗含2025年一级市场科技领域的核心风向转变：AI模型层的战争结束，投资人的注意力大幅涌向应用层。投资人的考察重点也开始转变——从技术判断、研究能力，更大幅度偏向创业团队的用户洞察、工程能力。这使得离产品更近的创业者开始更加受到投资者们的青睐。

2025-06-10 11:37:56 181

原创 AI产品经理薪资待遇：30k起步并非遥不可及，0基础也能成功转行！

AI产品经理是对AI技术应用和功能落地负责，并为公司带来商业价值的一群人，主要集中在。

2025-06-10 10:52:42 231

原创构建自我进化的知识图谱：AI Agent系统赋能新时代

在数字化浪潮日益澎湃的当下，数据领导人正行走在锐变与革新的钢丝绳上。一方面，科技日新月异，业务与技术的模式远非2024年初可同日而语，从编码、管理到日常操作，变化的步伐不断加快。另一方面，传统遗留系统、碎片化平台与转型团队之间的落差与阻力愈发明显，需要在新旧系统交锋中追赶变革步伐。过去，“数据越多越好”的观念逐渐让位于“数据越多越乱”，对更高效、更清晰的数据组织模型的需求日益突出。

2025-06-09 21:02:31 554

原创《Happy-LLM》完整PDF首发！一周2.3k+star的大模型“顶流教程”

开源仅一周，《Happy-LLM》从零开始的大语言模型原理与实践教程 GitHub star数量已经突破2.3k，成为大模型学习圈的“顶流教程”！

2025-06-09 20:41:40 525

原创这AI有点东西！Embodied-Reasoner，视觉、推理、行动全都会？

是由浙江大学、中科院软件所和阿里巴巴达摩院等机构联合提出的一个开源的多模态具身模型。它能够将深度推理能力扩展到具身交互任务中，处理复杂的具身任务，例如在 AI 2-THOR 模拟器中搜索隐藏物体、操纵和运输物品等。该模型通过整合视觉搜索、深度推理与动态规划能力，显著提升了具身任务的执行效率与成功率，甚至超越了 OpenAI 的 o1 和 GPT-4o 等先进模型。

2025-06-07 11:01:02 782

原创 DeepSeek主动学习：把“垃圾”数据变成“黄金”的工程实践指南！

DeepSeek主动学习系统通过构建"数据价值感知-智能采样决策-持续学习进化"的完整技术栈，正在重塑AI工程化落地范式。在某国家级智能电网项目中，该方案成功处理了包含20%噪声数据的百万级设备日志，将故障预测准确率提升至98.3%，同时将数据标注成本压缩至传统方法的1/15。随着多模态大模型、神经符号系统与边缘计算的深度融合，主动学习技术将在工业4.0、智慧医疗、数字孪生等关键领域释放更大价值，推动AI从"数据消耗者"向"数据炼金师"的范式跃迁。

2025-06-07 10:51:51 956

原创 AIGC时代黑马Manus来了！内测码曾10万难求，这本书教你如何用它效率翻倍！

就在不久前的5月13日，Manus正式向全球用户开放注册，这个消息瞬间引爆AI圈！过去两个月，它的内测邀请码在二手市场被炒到10万元天价，如今无需邀请码，人人都能注册，还能领取1000积分奖励、享受每日免费任务，更有三档付费订阅解锁高阶功能。一时间，全球用户争相涌入，有人让Manus15分钟生成19个文档的旅行计划书，也有人用它高效完成工作项目，其强大的任务执行能力展露无遗。但面对这个功能强大的AI智能体，很多人却不知道该如何上手？怎样才能充分发挥它的潜力？

2025-06-07 10:29:45 776

原创从零开始学 Dify- RAG 知识库系统设计详解

RAG 知识系统遵循三阶段提取-转换-加载 (ETL) 流程进行文档处理，并结合复杂的检索机制进行知识访问。

2025-06-04 11:49:32 630

原创医疗大模型的生意经：厂商大模型一体机卖爆，医院实际使用场景却少

今年年初，国产大模型DeepSeek横空出世，并在医疗体系内掀起了巨大声浪。行业里几乎每天都有不同医院官宣接入DeepSeek大模型的消息发布，从最初的“全省首家”到后来的“全市80多家二级以上公立医院全部接入”。据不完全统计，3个多月时间里，国内已有上千家医院完成DeepSeek大模型在院端的本地化部署。在众多医院的官方报道中，院端接入DeepSeek大模型后，能够全面提升传统AI的能效，应用场景主要集中在预问诊、临床辅助诊断、影像分析、个性化治疗及院内流程优化等环节。

2025-06-03 21:11:58 627

原创从零开始：手把手搭建你的 RAG 知识库

Word2Vec是一种用于处理自然语言处理的模型，它是在2013年由Google的研究员Mikolov等人首次提出的。Word2Vec通过训练海量的文本数据，能够将每个单词转换为一个具有一定维度的向量。这个向量就可以代表这个单词的语义。因为这个向量是在大量语境中学到的，所以这个向量能很好的表达这个单词的语义。Word2Vec包括Skip-Gram和CBOW两种模型，主要是通过优化模型计算词与词之间的关系，从而获得词的向量表示。Skip-Gram模型是通过一个词预测其上下文。

2025-05-29 09:30:00 891

原创 3个月转型AI产品经理：从入门到年薪50W+的实战指南（附项目清单）

AI不是取代产品经理，而是淘汰不会用AI的产品经理。掌握这套转型方法论，用现有经验撬动AI赛道红利，下个月坐在大厂工位写PRD的可能就是你！

2025-05-29 07:45:00 866

原创免费下载|火遍全网的【斯坦福团队】CS324：Large Language Models，值得所有学生收藏

系统讲解大型语言模型（LLM）的核心理论、训练方法、应用场景及社会影响，结合前沿论文与实战案例，是学习LLM的权威开源资料。

2025-05-28 10:28:22 904

原创 bioRxiv 2025｜PhysDock：用于蛋白质-配体复合物预测的物理引导全原子扩散模型

准确预测蛋白质-配体复合物在结构生物学中仍然是一个中心挑战。传统方法在计算上效率低下，容易陷入局部最小值，而深度学习方法则难以捕捉结构的灵活性和物理合理性。作者引入了PhysDock，这是一个物理引导的扩散模型，它独特地整合了：(i)全原子扩散来模拟配体的灵活性和蛋白质的精确性-灵活性（即微妙的构象调整）；(ii)物理先验作为扩散条件，以及在去噪扩散过程中的两阶段物理引导，以确保物理合理性。

2025-05-27 11:59:54 812

原创内又一新兴岗位在崛起！月薪已炒到6W？这才是程序员未来3-5年最好的就业方向！

2025 年刚开年，就像一颗重磅炸弹，在IT人的职业领域炸出了新的格局。阿里云核心业务全面接入，字节跳动的后端岗位要求具备腾讯、京东、百度等大厂也纷纷敞开怀抱，招聘岗位都和 AI 相关。大模型就像一个神奇的魔法棒，正在重新绘制技术开发的蓝图，传统的 CRUD 开发模式渐渐被 AI 原生应用挤到了角落。这可不仅仅是技术上的小波动，对于很多程序员来说，这简直就是一场！曾经那些热门的开发框架和大数据工具，已经不再是通往理想工作的万能钥匙!

2025-05-24 11:19:50 682

原创传统程序员如何转型AI大模型程序员？

兄弟们！现在用Cursor写代码确实爽，但你知道这玩意其实是慢性毒药吗？当编程变得和用Word一样简单，老板还需要花钱雇你写CRUD吗？未来5年真正值钱的程序员，都是懂大模型原理的程序员！随着模型架构的改进、硬件的国产化替代、算力资源的共享等方式，未来几年大模型训练的成本会急剧下降。当大模型的训练成本降低到一定程度的时候，中小企业也就能参与大模型的游戏了，到时候市场对懂AI大模型原理的程序员的需求会激增。因此，程序员真正的出路在于，做一个懂AI大模型原理的程序员。

2025-05-24 10:47:06 679

原创刚刚！首个下一代大模型Claude4问世，连续编程7小时，智商震惊人类

复杂推理，编程能力都有飞跃，上来就会「勒索人类」。全世界都在等待 GPT-5、DeepSeek V4，但今天起，大模型竞争已经进入了全新阶段。北京时间周五凌晨，知名 AI 创业公司 Anthropic 正式推出 Claude 4 系列大模型。先期推出的型号包括 Claude Opus 4 和 Claude Sonnet 4，它们为代码生成、高级推理和 AI 智能体树立了全新标准。

2025-05-23 11:42:54 872

原创 Claude 4空降！AI编程真神登场，连续7小时自主编程，写代码效率拉满

Amodei称，Claude Sonnet 3.7发布仅两个半月，却感觉像过了一年，这足见AI领域的发展之快。他强调，Claude 4的模型能力来自预训练和后训练的共同进步，预训练Scaling Law依然有效，后训练技术也在同步发展，二者相辅相成。展望未来AI领域的发展，Amodei认为我们会在未来一年我们将见证编程领域的革命，从Claude Code出发，我们将进入“智能体舰队”时代，成批的智能体会将软件开发自动化，定制化软件的成本显著降低，这将重塑开发者、企业和初创公司的角色。

2025-05-23 11:29:08 1037

原创解锁 MCP 工具管理新姿势：Docker MCP 如何让开发者的生活更简单、更安全？

因为频繁的使用 MCP，所以在管理和使用 MCP 的过程中会越来越关注它的可靠性和易用性，很多时候 API 密钥一不小心就push 到 Github，又还有 MCP 太多，也不好管理。近期看到 Docker 针对 MCP 在功能上做了升级，而且，体验下来觉得不错，推荐给大家。接下来，我会想列举出使用 Docker MCP 的好处，还有在 IDE 上的配置，以及喂饭级别的安装教程。

2025-05-22 21:01:10 707

原创如何让 Agent 规划调用工具

如下图，tool A 和 tool B 是调用一次模型，输出了两个工具，模型在输出 tool B 的时候并不会拿到 tool A 的执行结果，这种情况就是并行调用，适合没有依赖关系的工具调用。例如用户问「北京和上海哪里比较热」，模型可以并行调用两次天气工具。第二次调用模型输出 tool C 的时候，模型的上下文已经拿到了 tool A 和 tool B 工具的执行结果，这种情况适合工具之间有依赖的场景。

2025-05-22 20:59:50 994

原创 ChatDiet-基于大模型增强框架的AI营养师，提升个性化营养导向的食物推荐Chatbot

食物对健康的深远影响需要先进的以营养为导向的食物推荐服务。传统方法通常缺乏个性化、可解释性和互动性的关键要素。虽然大型语言模型（LLMs）带来了可解释性和解释性，但它们单独使用未能实现真正的个性化。本文介绍了ChatDiet，一个专为个性化营养导向食物推荐聊天机器人设计的新型LLM驱动框架。ChatDiet整合了个人模型和人群模型，辅以一个协调器，无缝检索和处理相关信息。个人模型利用因果发现和推理技术评估特定用户的个性化营养效果，而人群模型提供关于食物营养成分的概括信息。

2025-05-16 14:53:04 831

原创终于，GPT-4.1全量上架ChatGPT：大家都看好我，偏偏我也争气

很好，今天一打开 ChatGPT 主页，发现 GPT-4.1 和 GPT-4.1-mini 上线了。很多人还记得，最开始，OpenAI 并没有打算让 GPT-4.1 和 GPT-4.1 mini 上线 ChatGPT，只是面向开发者推出了 API。因为这两个模型的定位，自诞生那一天就是**「OpenAI o3 和 OpenAI o4-mini 的替代方案」**，用来满足开发者更简单的日常编程需求。一般来说，GPT-4o 是可以解决大部分日常任务的，所以我们日常对话一般默认用这个模型。

2025-05-16 11:36:40 1160

原创 DeepSeek接入个人知识库，回答速度飞快，最新安装包即将发布！

本文介绍了本地知识库管理软件。

2025-05-15 11:28:14 889

原创 AI大模型年度发展趋势报告

中国工业互联网研究院全方位剖析大模型发展态势，从技术发展、生态建设、应用落地、商业模式等多维度深入研判，梳理出七大核心发展趋势。在文本能力上，随着模型参数、训练数据和训练时间的增加，模型文本能力的上限不断刷新。在多模态能力上，实时对话延迟显著缩短；图片理解、视频生成、图像生成的基准测试最高分不断被突破。在复杂思维能力上，模型后训练从单次采样转化为思维链强化和规模化采样，大模型应对代码、数学等高阶推理能力快速演进。模型处理容量上，大模型的上下文窗口不断扩大，上下文窗口中位数已达128k，闭源最大已达200万。

2025-05-15 11:24:01 2386

原创 Manus积分不够用！Coze太复杂！教你三步开发智能体Agent【Trae小白教程】

大家还记得前阵子很火的通用 AI Agent 工具当时邀请码都炒到天上去了，5万、10万的都有。**Agent服务，简单来说，它就像个超级能干的私人助理，**可以帮你一步步执行一些复杂的内容生成任务比如帮你写个长文、做个市场调研报告。然而，随着内测范围扩大，用户评价逐渐下滑。如今也终于开放了全面注册。，新老用户天都能至少免费体验一次。Manus火了之后，百度心响、Genspark、Fellou、Coze空间一个个都坐不住了。AI Agent，妥妥地成了各大公司眼里的下一个风口。

2025-05-14 11:01:30 1712

原创腾讯云上线「AI开发套件」：5分钟搭建AI Agent小程序，支持MCP托管

DeepSeek-R1、混元 T1、混元Turbos……最近，很多开发者、企业技术团队都在忙着「接入大模型」。但接入只是起点，要真正打造一个能对话、懂业务、会操作的「Agent」，远比想象中复杂：选模型、写提示词、搭环境、打通数据、跑流程，怎么都得折腾好几天。要是想扩展一项新功能，还得自己写插件、搭服务器、跑运维，开发链路长、成本高、运维压力大。现在，这一切可以变得更简单。腾讯云正式发布「AI开发套件」—————

2025-05-14 10:56:44 920

原创 deepseek+即梦+Vidu做视频，真的王炸组合！AI还原古诗词《咏鹅》，保姆级别教程

自从做了立夏短片之后，这个王炸组合我就一直在复用了：deepseek+即梦+Vidu。文章分为五大部分：一、脚本创作（deepseek）二、画面制作（即梦AI）三、视频制作（Vidu）四、剪映剪辑，时长01:01让我看看是谁，还不会用deepseek（免费）写脚本和关键词？打开网站，输入：写一个《咏鹅》的视频脚本，原文是：鹅，鹅，鹅，曲项向天歌。白毛浮绿水，红掌拨清波。（记得勾选深度思考）一会儿给你安排一个脚本，接下来按照脚本出图，出视频就行了。

2025-05-13 10:30:00 818

原创关于人工智能应用场景中前期数据处理的业务场景和技术分析——包括结构化数据和非结构化数据

文档处理是人工智能应用领域中的重要环节，其业务需求复杂，技术实现难度高；因此，怎么处理复杂文档是每个技术人员都需要考虑的问题。文档处理在当前人工智能行业下是一个非常基础也非常重要的工作，不论是模型的训练和微调，还是以RAG检索增强，亦或者是在传统的搜索引擎(包括百度，谷歌这种搜索引擎；以及电商等内部平台的搜索需求)中都是必不可少的一个重要环节。但面对复杂的文档格式和类型，文档处理的难度相当大；而且在不同的需求场景下，同样格式和内容的文档需要不同的处理方式；

2025-05-13 10:15:00 639

原创 vLLM单卡跑LoRA模型，CPU又爆了...

但是 tp>1 的时候，神奇的事情发生了，cpu 不会被打满，这个 warmup lora 的过程很快就完成了。一开始以为是这个过程会构建 cudagraph，tp=1 的时候，v1 引擎会错误的使用 cpu 去构图。而 tp>1 的时候会用 gpu 去构图，于是提了一个 issue 到 github 上，几个星期过去了，硬是从 0.8.3 版本熬到 0.8.5 都没有得到解决。

2025-05-12 09:15:00 1033

原创刚刚，ChatGPT的深度研究可以连接GitHub了！网友：这是真·RAG

ChatGPT在深夜又更新了一波大的——（Deep Research）功能，现在可以直接了！那么效果又是怎样的呢？例如我们在点击“深度研究”的同时，提出一个需求：我最近加入了团队，并接到一项任务要求熟悉我们的GitHub代码库。请提供一份简要报告，内容包括：项目目的与架构、关键模块、技术栈、值得关注的开源问题/合并请求，以及两项可执行的代码质量改进建议。在发送问题之后，输入框底部就会出现**“GitHub”**的选项；

2025-05-10 10:15:00 992

原创 25种RAG架构大揭秘：AI项目如何选型？

在当今的AI时代，你是否想过，如果AI能够每次都从全球知识中精准地提取完美答案，那会是怎样的体验？检索增强生成（Retrieval-Augmented Generation，简称RAG）正是实现这一目标的幕后英雄。从ChatGPT引用来源的能力到企业AI扫描数千份文件，RAG为语言模型提供了现实世界的根基。然而，RAG并非“一刀切”的解决方案。随着时间的推移，AI研究人员设计了多种专门的RAG架构，每种架构都针对不同的现实世界瓶颈进行了优化，比如幻觉、响应延迟、较差的现实根基或有限的上下文。

2025-05-10 09:00:00 1000

原创 LLM4FTS：增强大语言模型用于金融时间序列预测，累积收益显著提高

预测金融时间序列面临低信噪比和复杂时间模式的挑战，传统机器学习模型能力有限。大型语言模型（LLMs）因其扩展的参数空间，展现出建模复杂时间序列依赖关系的潜力。现有LLM方法多集中于固定长度的分析，忽视了市场数据的多尺度特征。本研究提出了LLM4FTS框架，通过可学习的补丁分割和动态小波卷积模块增强LLM在时间序列建模中的能力。使用K-means++聚类和DTW距离识别市场数据中的尺度不变模式，进行自适应补丁分割以保持模式完整性。动态小波卷积模块模拟离散小波变换，灵活捕捉时频特征。

2025-05-10 08:30:00 1738

原创 HiRAG:基于层级知识索引和检索的高精度RAG

（如“DATA MINING”概括“BIG DATA”和“RECOMMENDATION SYSTEM”），摘要实体集合是所有聚类生成实体的并集。使用。

2025-05-09 11:27:03 672

原创一文彻底搞懂智能体Agent基于ReAct的工具调用

AI智能体是指具备一定自主性、能感知环境并通过智能决策执行特定任务的软件或硬件实体。它结合了人工智能技术（如机器学习、自然语言处理、计算机视觉等），能够独立或协作完成目标。基于大语言模型（LLM）的Function Calling可以令智能体实现有效的工具使用和与外部API的交互。支持Function Calling的模型(如gpt-4，qwen-plus等)能够检测何时需要调用函数，并输出调用函数的函数名和所需参数的JSON格式结构化数据。但并非所有的LLM模型都支持Function Calling(如d

2025-05-09 11:06:14 958

原创大白话解释Token：更多Token=更强AI？为何要用Token结算？

在自然语言处理（NLP）和大语言模型（如GPT系列）中，Token是文本的最小单位。你可以把Token看作是语言的“积木”或“像素”。就像搭积木一样，模型通过组合这些Token来构建句子、段落甚至整篇文章。举个例子：👉英文句子：“I love learning.” 可能被拆分为三个Token：“I”，“love”，“learning”。👉中文句子：“我喜欢学习。”可能被拆分为三个Token：“我”，“喜欢”，“学习”。

2025-05-08 11:14:21 1107

原创 RAGFlow vs Dify, 商业化落地场景选哪个？

RAGFlow 与 Dify 代表了对话式 AI 的两种发展路径：前者在。

2025-05-08 11:13:12 2029

原创大模型入门指南 - Inference：小白也能看懂的“模型推理”全解析

* 模型推理是训练好的大模型从“学习知识”到“实际应用”的核心环节。模型推理 = 让训练好的模型"干活"（比如回答你的问题、翻译文本、生成文章等）。**模型推理的本质是通过*为什么需要*Inference（模型推理）*？模型推理是AI的“最后一公里”——训练赋予知识，推理激活价值；若仅有训练，模型便如“空有蓝图”的图纸，永远无法落地为“解决问题”的生产力工具。********模型如同一个刚出生的“婴儿大脑”（随机初始化的参数），无法理解任何信息，也无法解决实际问题。

2025-05-06 11:23:55 1068

原创 Qwen3如何实现混合推理？

近期，阿里云发布的通义千问 Qwen3 系列模型以其混合推理能力引发了广泛关注，它能够在快思考与慢思考模式之间灵活切换，为不同任务提供精准且高效的解决方案，本文将深入探讨其背后的实现原理。Qwen3 引入动态门控机制来实时评估任务复杂度，其核心是对输入任务的多维度特征进行分析，如文本长度、关键词、语义复杂度等。

2025-05-06 11:22:36 1215

原创 Qwen3来了，全尺寸开源，性能拉满！附最新一手实测！

这两天技术群都在传阿里通义 Qwen3 五一前后发布，然后昨晚各种消息满天飞：一觉醒来，千问果然没有让人失望，赶在五一前发布并开源Qwen3，效率杠杠的。作为国内首个实现""能力的开源模型，Qwen3不仅达到了36万亿token的训练数据量，还支持119种语言和方言。通过混合专家（MoE）架构与混合推理机制的深度整合，在参数效率与任务适应性层面实现双重突破。旗舰模型Qwen3-235B-A22B在数学证明、代码生成等核心基准测试中，展现出与DeepSeek-R1、Grok-3等顶尖模型的竞争优势。

2025-04-30 17:25:05 1265 1

原创 Qwen3 发布，第一时间详解：性能、突破、训练方法、版本迭代...

从2023年4月，通义千问首次亮相，到2025年4月，Qwen3全面发布，短短两年，三代更新，阿里一步步把自己的大模型打磨到了世界顶级水准从最初的闭源探索，到如今 Dense、MoE 双线并进、思考模式无缝切换、超长文本系统优化……每个节点，都是硬仗这一路，真的不容易。

2025-04-30 17:20:59 1510

原创手把手教你微调大模型：从数据清洗到训练部署全流程实战（附完整代码）

本教程使用🤗HuggingFace TRL框架来完成微调代码的实现。TRL是一个强大且便于使用的微调框架，除了支持SFT外，也能轻松的通过接口调用DPO、PPO、GRPO等流行的强化微调算法。此外也完美兼容Transformers架构。

2025-04-28 11:54:15 1163

空空如也

空空如也