LLM Weekly（2025.01.27-02.02）

UnknownBody

于 2025-03-01 10:00:00 发布

阅读量198

点赞数 6

CC 4.0 BY-SA版权

分类专栏： LLM Daily LLM Weekly 文章标签：人工智能自然语言处理语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/145776645

LLM Daily 同时被 2 个专栏收录

1734 篇文章 ¥99.90 ¥299.90

订阅专栏

超级会员免费看

40 篇文章

订阅专栏

本次主要是针对1.27-2.02之间的LLM 论文和相关新闻进行摘要总结。

1 新闻

OpenAI发布了o3 mini。OpenAI推出了o3 mini，这是一种经济高效的模型，在STEM领域提供了增强的推理能力，并提供了不同推理努力的选项。它在数学、编码和科学任务方面优于以前的模型，同时减少了延迟。开发人员可以通过多个API访问它，ChatGPT Plus、Team和Pro用户可以获得更高的速率限制。
DeepSeek发布开源AI图像生成器，美国股市继续暴跌。DeepSeek发布了开源AI图像生成器Janus-Pro-7B，其性能优于DALL-E和Stable Diffusion。随着DeepSeek凭借其R1模型在苹果应用商店上超越了ChatGPT，它面临着网络攻击，但仍保持服务。
Meta创建了四个“作战室”，以揭示DeepSeek如何以更低的成本超越竞争对手。Meta已经建立了四个“作战室”来调查DeepSeek在人工智能领域的快速成功，这威胁到了像ChatGPT这样的行业巨头。尽管其R1模型的投资低于600万美元，但DeepSeek在其新的Janus Pro 7B图像模型上表现出色。Meta旨在通过了解DeepSeek的成本削减和技术进步来增强自己的人工智能Llama。
Huggingface在Open-R1上工作：DeepSeek-R1的完全开放复制品。Hugging Face正在开发Open-R1来重建DeepSeek-R1的推理模型，重点是透明度和可重复性。Open-R1将蒸馏

了解本专栏

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。