最新开源:「天工大模型4.0」o1版来了!国内首款中文逻辑推理能力o1模型

来源:HsuDan

昆仑万维发布 Skywork o1,国内首款中文逻辑推理能力o1模型

11月27日,昆仑万维公司宣布正式推出其最新研发成果——“天工大模型4.0”o1版(Skywork o1)。

Skywork o1 是国内首款具备中文复杂推理能力的o1模型,具备自我反思思考链技术,能模仿人类的思维过程,显著提升逻辑推理和复杂任务解决能力。

在这里插入图片描述

  • 申请地址:www.tiangong.cn
  • 开源地址:https://tinyurl.com/skywork-o1

此次发布的 Skywork o1 包括三款模型,既有回馈开源社区的开放版本,也有能力更强的专用版本:

  • Skywork o1 Open:一款基于 Llama 3.1 8B 的开源模型,该模型在同生态位开源模型中评测指标大幅提升达到 SOTA 水平,并解锁了许多轻量级模型无法解决的复杂数学任务。
  • Skywork o1 Lite:该模型具备完整的思考能力,具有更好的中文支持和更快的推理和思考速度。在数学、中文逻辑和推理类问题上表现突出。
  • Skywork o1 Preview:这款模型是本次完整版的推理模型,搭配自研的线上推理算法,对比 Skywork o1 Lite 有着更多样和“深度”的思考过程,更完善和更高质量的推理。

在这里插入图片描述
在这里插入图片描述

Skywork o1 模型以其独特的慢思考推理能力脱颖而出。与当前市场上基于OpenAI o1模型的复现工作不同,Skywork o1 不仅在输出结果上展现了深度的思考、规划及自我反省能力,而且在标准测试集中的表现远超常规模型,实现了推理性能的显著提升。

Skywork o1 的实战效果如何?

在这里插入图片描述

图:在比较 13.8 与 13.11 孰大孰小时,Skywork o1 Lite 给出了完整的思维链路,找出解题的关键在于小数位大小。

在这里插入图片描述

图:在求解组合(从 10 人中选出 3 人组成一队,共多少种选择)问题时,Skywork o1 Preview 在全链路思考过后,答案正确。

欢迎各位关注我的个人微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值