deepseek究竟处于一个什么水平?

星河的知乎回答-deepseek究竟处于一个什么水平?

DeepSeek 超越了 Meta Llama 毫无疑问,但相比 OpenAI、Anthropic 和 Google 这些第一梯队 players 可能还有些距离,比如 Gemini 2.0 Flash, 它成本比 DeepSeek 更低,能力也很强,且全模态。我们不能低估以 Gemini 2.0 为代表的第一梯队的能力,只是它们没有开源而获得这么炸裂轰动性的效果。

从技术角度上讲,DeepSeek 有下面几个亮点:

• 开源:开源这点很重要,OpenAI 从 GPT-3 开始转为闭源公司后,第一梯队三巨头就不再公开技术细节,拱手让出了一个空白的开源生态位,但 Meta 和 Mistral 并没有接稳这个位置,DeepSeek 这次堪称奇袭,在开源这块大赛道一马平川。

如果把轰动性打 100 分,智能提升贡献 30 分,开源贡献 70 分,之前 LLaMA 也开源但没有这么轰动的效果,说明 LLaMa 智能水平不够。

• 便宜:“Your margin is my opportunity” 这句话的含金量还在上升。

• 联网+公开 CoT:对于用户这两个点分别都能带来很好的用户体验,DeepSeek 把两张牌同时出了,可以说是王炸,给到 C 端用户的体验和其他 Chatbot 完全不一样。尤其是 CoT 透明,把模型思考过程公开了,透明能让用户对 AI 更信任,促进了破圈。不过,按理说 Perplexity 也是冲击很大的,但 DeepSeek 服务端不稳定,Perplexity 团队快速反应上线了 R-1 反而承接了很大 DeepSeek R-1 溢出的用户。

• RL 泛化:虽然 RL 是 OpenAI o1 最先提出来的,但因为各种运营一直半遮半掩,渗透率并不高,DeepSeek R-1 很大意义推动了 reasoning model 范式的进程,生态接受度大幅提升。

严格来讲,DeepSeek 并没有发明新范式,它的重要意义在于帮助 RL 和 test time compute 这个新范式真正出圈。如果说 OpenAI 最初发布的 o1 是给行业出了一个谜语,DeepSeek 就是第一个公开解谜的人。

DeepSeek 发布 R1 和 R1-zero 之前,行业只有少部分人在实践 RL 和 reasoning model,但 DeepSeek 给大家指明了路线图,让行业相信这样做真的能提升智能,这对提升信心,吸引更多 AI researcher 转向新范式的研究有巨大的帮助。

有人才进入,才有算法创新,有开源紧追才有更多计算资源投入。在 DeepSeek 之后,原本计划不再发新模型的 OpenAI 接连发出 o3mini,并计划继续发布 o3,还考虑开源模型。Anthropic 和 Google 也会加快 RL 的研究。行业对新范式的推进因为 DeepSeek 加快,中小团队也可以在不同的 domain 上尝试 RL。

另外,reasoning model 的提升会进一步帮助 agent 落地,AI researcher 现在都因此对 agent 的研究和探索更有信心,因此也可以说 DeepSeek 开源 reasoning model 推进了行业向 Agent 的进一步探索。

---------------

 关注公众号“星河AI观测站”,领取DeepSeek及AI学习资料~

FFmpeg是一款功能强大的开源多媒体处理工具,广泛应用于视频和音频的编码、解码、转换以及流媒体处理。然而,由于历史原因和标准限制,原生的FFmpeg并不支持将H.265(高效视频编码)格式的视频流封装到FLV(Flash Video)容器中。FLV是一种常见的网络流媒体传输格式,但其最初设计时并未考虑现代高效的H.265编码标准。因此,当尝试将H.265编码的视频与FLV容器结合时,会出现“Video codec hevc not compatible with flv”的错误提示,表明FFmpeg无法识别这种组合。 为了解决这一问题,开发者通常需要对FFmpeg的源代码进行修改和扩展。一个名为“用于解决ffmpeg不支持flv+h265需要修改的文件.zip”的压缩包中包含了一些源代码文件,这些文件旨在扩展FFmpeg的功能,使其能够处理FLV容器中的H.265编码内容。压缩包中的三个关键文件分别是“flvdec.c”“flvenc.c”和“flv.h”,它们分别对应FLV的解码器、编码器和头文件。 flvdec.c:这是FFmpeg的FLV解码器源代码,经过修改后可能支持读取和解析包含H.265数据的FLV流。解码器的作用是从FLV容器中提取视频数据,并将其转换为可处理的原始像素格式。 flvenc.c:这个文件包含FLV编码器的源代码,经过调整后可能允许将H.265编码的视频流封装到FLV容器中。编码器负责将原始视频数据编码为H.265格式,并将其打包到FLV文件中。 flv.h:这是一个头文件,定义了FLV格式相关的常量、结构体和函数原型。修改该文件可能涉及添加或更新与H.265支持相关的定义和接口。 要应用这些修改,开发者需要重新编译FFmpeg源代码,并将修改后的版本替换原有的FFmpeg安装。这样,用户就可以使用定制版的FFmpeg来处理FLV+H.265的
### DeepSeek概述 DeepSeek一个先进的大型语言模型,专为应对复杂的编码任务而设计。此模型在多种编程基准测试中展现了出色的性能,在工程和算法任务方面均取得了优异的成绩[^1]。 ### 技术特点 #### 1. 编码能力 DeepSeek-V3在处理各种编码任务上表现突出,尤其擅长解决算法类问题。尽管在某些具体的工程任务上不如其他商业模型,但在开源领域内仍处于领先地位,并且有望促进未来开源社区内的技术创新和发展。此外,该版本还在多个知名代码评估标准下超越了先前记录保持者的表现水平。 #### 2. 混合专家(MoE)架构的应用 为了增强自身的灵活性与效率,DeepSeek采用了独特的MoE结构——即把整体框架细分成若干个小规模的‘专家’模块来共同完成工作流程。这种方法允许系统依据具体需求灵活调配资源,只激活必要的组件参与运算过程;同时减少了不必要的计算量,提高了运行速度。特别是针对像DeepSeek-V3这样的大规模实例而言,它拥有超过一万四千名不同的‘专家’成员协同作业,极大地促进了系统的稳定性和适应性[^2]。 #### 3. 基于Transformer的推理机制 当接收到经过初步整理后的数据流之后,DeepSeek会利用基于自注意力机制构建起来的核心引擎来进行深层次的信息解析。通过对上下文环境的理解以及语义关联度的学习,最终实现高质量的回答生成或是程序编写等功能[^3]。 ```python def deepseek_inference(input_data): processed_input = preprocess(input_data) # 使用基于Transformer的深度神经网络进行推理 output = transformer_model(processed_input) return postprocess(output) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值