DeepSeek太火，但老板们别慌，这里有份AI项目开展手册-优快云博客

关注公众号回复1

获取一线、总监、高管《管理秘籍》

这两天有老板陆续在咨询：到底应该如何基于DeepSeek开展AI项目？

抛开一些偏细节、偏敏感的付费内容，其实有一套方法论倒是可以分享。

第一，也是最重要一点：目标是什么？

AI产品的目标是什么？

据群里的粉丝反馈，开工第一天几乎所有的老板都在讨论AI、讨论DeepSeek。

并有多个CEO表示：后续业务开展，全面拥抱AI，并期待实现行业应用的领先！

说实话，这个味道很熟悉，基本又回到了两年前ChatGPT刚诞生的情况，很多公司出于焦虑或者想要抢占行业注意力，都做好了准备 All In AI，但这里我要泼一点冷水：你的急迫可能导致巨大损失！

一、DeepSeek并没有领先于GPT

首先，所有人必须认识到的一个事实是：虽然DeepSeek非常优秀，但他并没有领先于GPT！

换句话说，之前各位可以根据GPT的API调用完成的功能，如果基座模型换成DeepSeek后，他的表现可能还会差点。

DeepSeek真正的价值在于两点：

第一、合规性，他是国内的开源模型，并且能力优秀，这可以为医疗、金融等相对敏感的行业松绑，他们有更优的基座模型选择了。

而由于基座模型的进化可能带来的价值是：实现路径的大幅成本降低！这可以节约不少钱。

第二、可以私有化部署，并且训练的成本极低！

常规的AI产品基础技术架构事实上只有两条：API、API+知识图谱。

之前多数人认为预训练+微调是错误的技术选择，其核心是高昂的成本。

现在基于DeepSeek的微调貌似成本也不高，这会导致新的技术路径产生，而API、API+知识图谱、基于微调的AI产品三者之间差异是什么，到底如何选择，很多人是模糊的。

二、可以兴奋但别焦虑

老板们逐渐相信AI会重塑所有，于是他们会想用AI的方式将公司产品重塑一次。

这会引发第一轮的焦虑，因为没有可以抄的对象，多数人是不知道怎么做的！所以多公司现在是既迷茫又兴奋：

兴奋的点在于，行业洗牌的机会来了，抓住了就是下一个头部；
迷茫的点在于，那是真的不知道该怎么做；

首先是AI对于自己的产品意义是什么，比如是产品用上AI的能力，还是用AI能力去重塑产品，不清楚；

其次是AI能力的边界在哪里，比如数据对于大模型幻觉的意义是什么，是否要投入大量资源去整理数据，不敢赌；

然后是具体的技术路径是什么，比如是API还是微调，不明白；

其实这里有个判断依据：在DeepSeek出现前，GPT的表现已经足够优秀，如果你们公司在之前没出太多创新，今年也很难马上做出什么。

这里的原因是AI产品的非对称性。

三、非对称性

无论是GPT还是DeepSeek，他们都太强大了，基于他们做出来的AI产品容易让我们产生一个幻觉：我们公司的AI太强大了！

醒醒吧，这是幻觉！AI很容易产出一个demo，但很难得到一个应用！

大白话是：业务判断AI产品能不能用的标志是能不能完全接管业务，如果不能就是玩具！

对于AI应用，你可以用一周时间完成一个demo；但半年后，实现的产品效果依旧不能超越这个demo！

这里非对称性也就出来了，花费10%的资源可以得到一个70分的demo；想要将70分推到90分，可能你需要1000%的资源！

入门简单，精通难！大模型是很容易造成老板/产品/技术错误判断的存在，如果轻易承诺，肯定会坑了自己。

所以，想要AI在应用上表现出现，必须要有耐性！

四、耐心很重要

做AI项目，耐心是很很重要的，简单来说：你认为Prompt提示词困难吗？

Prompt不是有手就行嘛，谁会中文还不会写点提示词，但Prompt其实很难：

首先，写出稳定输出的Prompt很难；
其次，在不同场景中Prompt要稳定输出更难；
最后，要与优质数据配合并且要稳定输出的Prompt很难；

这对我们的启示是什么呢？这对我们的要求是有耐心、有定力，不要因为今天产品表现得好而过分开心，也不要因为明天产品表现的弱智而过分焦虑。

保持平常心，去面对，去调整，因为提示词调优只是AI产品过程中最简单的部分，寻找正确的路径，试验正确的路径，才是其中的难点...

对于一般公司，AI项目的成败取决于技术团队工程能力的强弱，以及对相关领域的认知！

所以好的程序员跨界去深入学习某行业知识，再转做产品经理会变得十分吃香。

其次，在基座模型能力上来后，大家都是在70分水准的基线上竞争，如何通过自身的优势快速达到90分会成为占领高地的关键。

不急不躁

有了以上认知后，我们会达成一个共识：我们离成熟的AI应用诞生还有一段时间（1-2年），而就算已经有爆款产品出现，也不要慌张，产品层面的进步是最容易赶上的。他不会比DeepSeek比肩GPT更难！

所以，我们最应该想清楚两个问题：

目标是什么；
目标对AI能力的要求是什么；

如果GPT的能力值是100分（大学生水平），也许你的产品其实只需要70分（初中生水平）就够了呢？

在目标清晰后，就应该坚定的执行在这个窗口期（1-2年）将配套设施打磨好，而不是急于推出产品去吸引注意力。

在这个基础上，我们再来探讨如何做技术选型。

技术选型

出于敏感性考虑，这块我会去除大量细节，请各位海涵

基础技术选型

最基础的技术选择无非三块，提示词、RAG 和微调，其优劣如表格所述：

对比维度	提示词	RAG	微调
定义	通过优化输入文本，引导现有模型生成预期结果	将外部检索系统与模型结合，增强生成内容的准确性	使用特定领域数据对模型进行二次训练，提高定制化能力
开发成本	极低，无需模型修改	中等，需要搭建检索和存储系统	高，需要大量优质数据和计算资源
技术复杂度	低	中等，需整合检索系统和模型	高，涉及数据清洗、标注和训练流程
适用场景	灵活、轻量级需求，如客服对话、创意文案	需要实时更新或动态领域知识，如医疗、法律咨询	高精度、高专业性需求，如金融分析、企业知识问答
优点	快速、无成本、简单易用	知识扩展能力强，适合知识动态变化的场景	效果精确，满足专业化和领域化需求
局限性	受限于基础模型能力，难以满足高专业性或精度需求	对检索系统和知识库质量依赖较大	开发周期长，成本高，不适合快速变化的需求
响应速度	快	较快，但受检索系统效率影响	较慢，需事先完成模型训练
扩展性	高，直接基于现有模型	中等，依赖知识库更新与维护	低，需重新训练模型
典型应用	客服自动回复、生成文案、创意触发	医疗问答、法律建议、实时行业动态	行业专用AI工具、精准预测分析

产品实现路径

PS，这里涉及敏感信息，我做简要说明即可

其实，基础技术选型问题不值一提，他们既可以混用又可以不停转换，我们实际做开发过程中大概率三条路径都会用，所以这里的重点不是基础技术的选择而是产品实现路径的思考。

这里的核心为：模型只是一个API调用工具，工程实现是核心。

实际实现时候需要考虑几个点：

单纯基于大模型当前AI产品能达到的极限是什么，问题是什么；
基于AI产品的行业KnowHow是什么；
要打破AI产品的极限，需要的优质数据（数据+工程规则）是什么；
如何用工程的能力组织这套AI架构，实现数据、工程自迭代，最终形成飞轮系统；

具体来说：大模型的工作模式是输入输出：输入 -> Prompt -> 输出。

所有的工程能力全部会体现在这个Prompt，所谓Prompt就是我们对规则理解的文字化。

比如要做的是AI律师，这里的Prompt就是某著名律师这10多年的经验。

这个经验是理解用户问什么，然后给予他正确的法律反馈，如何给予用户正确的反馈，这就是该合伙人需要给技术工程的优质数据，也就是AI律师需要的输入输出规则。

而这里的“优质数据又是如何形成的呢？”答案是基于10几年律师问答的总结整理，他需要深刻理解关于输入输出五个部分：

大量输入(输入材料的相关性)；
输入正确(输入材料的正确性)
输入可理解（输入材料的多样性，泛化相关思考）
输出假设和及时反馈(强化学习的关键)
检索强化(如果有知识图谱，可能会用到的)

但大模型是一个新生事物，他所需要的优质数据/规则数据在以往时代大概率没有系统性的、完整性的存在。

因此，很多AI产品的推出都会有一个优质数据准备的阶段，在这个时间窗口下，对所有人都是一个机会，所以各位老板真的不用急。

只要将“优质数据”（数据+规则）是什么搞清楚，产品的实现路径自然而然就出来了。

而后的问题就是工程侧如何将这一切循环优化起来，形成一套飞轮系统，一旦飞轮系统形成，跟其他公司的差距就拉开了。

飞轮系统

就个人认知，想要延伸基座模型的能力只有两个做法：

第一是构建一套自己的行业知识库（知识图谱）。每次输入前将相关信息带上，如图所示：

第二是基于“行业知识库”形成多套微调数据，去训练模型。每次输入输出会变成这样：

第一套架构复杂起来会形成一个庞大的知识图谱、第二套其实就是MoE架构的雏形。

两套系统看似不同，其核心其实类似，都包括两点：

路由规则的优化；
专家模型如何优化；

所以在基础架构搭建完成后，真正困难的是工程控制：如何用海量优质增量数据去优化模型本身，这就是所谓飞轮系统。

其实这里的核心是：优质数据哪里来？，他包括：

初期数据哪里来？
中期哪里来？
后期哪里来？

初中期的数据与规则

首先，第一批少量优质数据的整理多半需要跨领域融合，比如律师+技术。

只不过，如果以律师+程序员的方式要产出数据成本是很高的，因为好的律师会很高傲；他很难配合程序员的工作，而程序员要达到律师行业的KnowHow是需要大量的时间的。

所以，程序员或者产品必须主动上前，软磨硬泡把核心规则与样例数据搞到手，而后必须有其他手段去处理这种矛盾，这里的核心有二：

程序员群体必须有基本KnowHow；
对行业专家（律师、医生）的使用方式要变；

KnowHow在这个合作模式喜爱要分为三个部分：

第一是知道怎么做——程序员必须会；
第二是知道找谁做——遇到规则问题程序员需求助领域专家；
第三是知道好不好，这里的核心是评价——让领域专家对应用打分；

经过一轮磨合，这对于程序员是比较轻松的，最终形成的合作模式是：AI产出数据，行业专家评价效果，根据效果优化数据，最终形成数据集+规则。

数据反馈回路

AI应用的优化依赖于数据反馈回路，即通过建立一个自我增强的飞轮系统，实现持续的自我优化。

以DeepSeek R1为例，初期通过少量专家标注数据启动，但关键在于后续的数据再生和强化学习。

机器通过自我探索和反复调整，逐步减少偏差，提升准确性，形成一个有效的反馈回路。

这种方式与传统监督学习不同，后者依赖人工标注数据的直接关系，而强化学习通过自主学习和数据再生，不断调整策略。

成功的飞轮系统不仅依赖专家数据，还需大量高质量数据的自动生成和修正。

技术与行业专家的合作，是推动飞轮系统有效运转的关键。然而，数据偏差和结果偏离可能是挑战，需要依赖飞轮系统的自我校正来精准化数据和反馈。

AI应用的飞轮系统需要耐心，因为优化过程是渐进的。关键在于建立持续的反馈机制和自我修正能力，推动数据的有效利用，进而提升系统的长期表现。

结语

今天，我们对如何开展AI项目的思路有做了一些简单探讨。

从明确目标出发，选择适合的技术路径，到构建AI产品的飞轮系统，每个环节都需要不停试错。

AI的应用和技术实现往往伴随挑战，尤其是在数据准备和工程实现方面。

构建飞轮系统、优化数据反馈回路，以及与行业专家的深度合作，这些都不是短期内能够轻松解决的问题。

虽然初期可能会面临一定的技术复杂性和高昂的成本，但这些投入和耐心，最终将为企业带来可持续的竞争优势。

文章中提到的技术选型和路径选择，可能给一些读者带来些许迷惑。

我们在此强调，AI项目并不是一蹴而就的，选择合适的技术和实现路径，取决于具体的业务需求和行业特点。

对于没有经验的企业来说，首先要清晰定义目标，再根据目标选择合适的技术，而不是一味追求“最先进”的解决方案。对技术路径的选择应当具备灵活性，随着项目进展及时调整。

总之，AI技术的应用和开发不仅需要深厚的技术储备，更需要扎实的行业知识和耐心。企业应理性看待AI应用，避免过度焦虑，逐步推动项目实施，才能确保在未来的竞争中占据有利位置。

PS：这是本周最后一篇AI相关文章，要开始发管理课程了，不然有点太不务正业了...

原创作者: yexiaochai 转载于: https://www.cnblogs.com/yexiaochai/p/18700942