DeepSeek-R1编程问鼎,媲美Claude 4!2025 AI上半场战报来袭

一觉醒来,DeepSeek-R1成功晋级编程第一梯队,与Claude 4、Gemini 2.5 Pro并列第一。这半年,AI领域群雄逐鹿,进展到哪一步了?权威统计机构SimilarWeb一份报告,给出了解答。

编程新王,又有一位玩家成功晋级。

刚刚,LMArena公布了最新WebDev Arena排行榜,DeepSeek-R1(0528)冲进第一。

新版DeepSeek-R1编程能力,现与Gemini 2.5 Pro、Claude Opus 4并驾齐驱。

图片

图片

在文本竞技场中,DeepSeek-R1是排名第一的开源模型,总体排名第六。

从细分类别来看,它在编程方面排名第2,在复杂提示词处理方面排名第4,在数学类别中排名第5。

图片

图片

图片

图片

图片

图片

可以看到,从Claude Opus 4发布,再到Gemini 2.5 Pro、DeepSeek-R1迭代,AI领域进展不断更迭。

如今2025年已过半,OpenAI仍是佼佼者;谷歌反超或成为最大的赢家;Meta处于落后地位;Grok 3.5迟迟没有音讯。

图片

图片

而整个GenAI行业的大风向,则可以从SimilarWeb的统计中窥见一斑。

5月数据显示,全球顶尖GenAI应用,每位活跃用户的日均使用时长中(基于安卓平台,过去28天的数据),ChatGPT、DeepSeek最高,而谷歌Gemini仅有17秒。

图片

图片

Veo 3出世,让谷歌流量暴涨了162%。

图片

图片

6月最新数据显示,过去一个月,不同应用总访问量,ChatGPT高达54.92亿、Gemini为5.277亿。DeepSeek、Grok有所下降。

图片

图片

生成式AI流量份额,6个月前同今天已有了翻天覆地的变化。

ChatGPT依占主导,谷歌强势崛起增长到8%。

图片

图片

生成式AI全球行业趋势

不仅如此,月初刚刚更新的「AI Global」报告,则提供了更多的洞察。

图片

图片

报告地址:https://www.similarweb.com/corp/wp-content/uploads/2025/06/attachment-Global-AI-Tracker.pdf

按不同领域划分的GenAI网站,开发与编码一直处于增长阶段,尤其是3、4月份涨超100%,一定程度上与爆火「氛围编程」概念有关。

另外,通用GenAI网站同样在3、4月有一个流量高峰。然而,写作与内容、教育科技AI、顾客支持与体验、旅游等相关网站呈下行趋势。

图片

图片

通用网站流量仍在全球占据大头,其次是角色与聊天、设计与图像,再之后是开发与编码。

代码补全和DevOps工具因解决实际生产力问题持续增长,而纯娱乐类(角色聊天)热度消退。

就AI工具流量,声音生成比例最高,随后是音乐生成、设计与图像生成。

图片

图片

OpenAI的增长一直以来都十分平稳;而谷歌凭借着在AI和相关功能上的持续发力,从3月起就一路高歌猛进,6月增长率直接飙升至95%。

新兴玩家如DeepSeek、Grok经历前期爆发后流量回落;而集成平台Poe,则一直在急流勇退。

图片

图片

图片

图片

代码补全与DevOps工具:增长之王

Lovable和Cursor持续领跑,增速稳居前列。

Lovable增速从10300%回落至72%,但仍是增长最快的工具,反映开发者对AI编程的强烈需求。

AI辅助编程已开始冲击SaaS DevOps与自由职业平台,预计未来开发者工具将进一步AI化。DevOps工具与CI/CD流程结合,降低技术门槛,吸引中小团队使用。

图片

图片

角色类应用整体下降5%,可能依赖炒作吸引流量,但功能同质化严重(如模拟对话),缺乏突破性应用场景,娱乐属性强但实用性不足。

其中,Character AI的流量增长从17%降至-4%;Replika则涨涨跌跌,波动较大。

图片

图片

图片

图片

图像设计工具整体下降,Midjourney(8%)增速相对稳定。但Getimg(-21%)、Stable Diffusion(-17%)波动较大。

图片

图片

图片

图片

写作与内容生成整体持续低迷,内容质量和原创性争议是主因。

Originality(29%)为少数正增长案例,Jasper(-29%)、Wordtune(-35%)下滑显著。

图片

图片

图片

图片

视频生成工具在连贯性上仍存在技术瓶颈,用户完成率不足,流量波动较大。

图片

图片

图片

图片

语音与音频生成:内容创作新蓝海

语音生成工具增长14%,Elevenlabs(29%)、Vapi(33%)、Resemble(43%)表现亮眼。

文本转语音(TTS)商业化加速,如Elevenlabs支持多语种、情感化语音生成,场景有自媒体与企业客服。

音频编辑工具简化制作流程,Resemble的AI配音技术在影视、广告领域渗透率提升。

图片

图片

图片

图片

语音生成AI工具中,Aiva在3-4月之间有一段流量高峰,Suno在4月底5月初有所增长。

总体来看,其他AI音乐生成工具在5、6月的流量呈下行趋势。

图片

图片

从流量占比份额看,Suno是所有AI音乐生成工具中,最受用户喜欢的一个,Musixmath次之。

图片

图片

自动化工具:企业降本增效的加速器

自动化工具总增长12%,低代码/无代码平台受中小企业青睐。

N8N的开源模式推动流量持续增长;Zapier因定价调整导致用户流失。

自动化从IT部门向营销、运营等场景延伸,Gumloop曾因电商自动化需求爆发,但后期因功能迭代不足回落。

图片

图片

图片

图片

在旅游行业,AI旅行工具中,Mindtrip和Iplan表现出显著的增长,分别在过去12周增长了78%和158%,展现出强大市场吸引力。

相较之下,Layla、Wonderplan、Tripplanner、Destinations和Magictravel的表现参差不齐。

图片

图片

流量份额表明,Mindtrip占主导地位,份额最大。

图片

图片

另外,浏览器工具Browser-Use在3月份暴增11256%后,从4月起持续下降。Browserbase在1-3月之间增长显著,但4月开始也是转为负增长。

图片

图片

流量份额数据显示,Browser-Use目前仍占据主导地位。

图片

图片

深受变革的领域:传统搜索流量下降

在报告中另一部分,还专门列出了如今深受GenAI影响的一些传统领域的变化。

比如,数字自由职业、传统教育科技过去半年,一直在上涨,只有讨论论坛流量下降。

图片

图片

值得关注的是,传统搜索的流量整体趋势呈负增长。

图片

图片

下图中展示了,谷歌在传统搜索市场中占据主导地位,而其他搜索引擎的流量和增长率相对较低。

图片

### DeepSeek-R1-Distill-Qwen-14B 模型介绍 DeepSeek-R1-Distill-Qwen-14B 是通过从大型预训练模型 DeepSeek-R1 进行知识蒸馏得到的一个较为紧凑的密集模型。该模型继承了 DeepSeek-R1 的强大推理能力和广泛的知识库,但在参数量上显著减少至 140 亿个参数[^2]。 #### 特点 1. **高效推理能力** 尽管参数规模减小,但 DeepSeek-R1-Distill-Qwen-14B 在多个基准测试中表现出色,在某些特定任务上的表现甚至超过了更大规模的基础模型 QwQ-32B-Preview。这种高效的推理能力使得其成为处理复杂自然语言理解和生成任务的理想选择。 2. **优化资源利用** 减少后的参数数量不仅降低了计算成本,还提高了部署灵活性。相比原始的大规模模型,此版本更适合于资源受限环境下的应用开发和实际部署。 3. **卓越的任务适应性** 继承自 DeepSeek-R1 的先进架构设计以及监督学习与强化学习相结合的方法论,赋予了这个较小型号出色的泛化能力和多领域适用性。特别是在数学竞赛类任务如 AIME 2024 中的表现尤为突出,超越了 GPT-4o 和 Claude 3.5 等竞争对手[^3]。 #### 应用场景 鉴于上述特性,DeepSeek-R1-Distill-Qwen-14B 可应用于多种场合: - **教育辅助工具**:能够帮助学生解答复杂的数理逻辑题目,提供精准的学习指导; - **智能客服系统**:凭借强大的语义理解力快速响应用户咨询并给出恰当建议; - **自动化写作平台**:支持高质量文章创作、摘要提取等功能需求; - **企业级数据分析服务**:用于构建高性能的数据挖掘算法或预测分析引擎。 ```python # 示例代码展示如何加载并使用 DeepSeek-R1-Distill-Qwen-14B 模型进行文本分类任务 from transformers import AutoModelForSequenceClassification, AutoTokenizer model_name = "deepseek-ai/deepseek-r1-distill-qwen-14b" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForSequenceClassification.from_pretrained(model_name) def classify_text(text_input): inputs = tokenizer(text_input, return_tensors="pt", truncation=True, padding=True) outputs = model(**inputs) predictions = torch.argmax(outputs.logits, dim=-1).item() return predictions ```
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值