来源:HsuDan
昆仑万维发布 Skywork o1,国内首款中文逻辑推理能力o1模型
11月27日,昆仑万维公司宣布正式推出其最新研发成果——“天工大模型4.0”o1版(Skywork o1)。
Skywork o1 是国内首款具备中文复杂推理能力的o1模型,具备自我反思和思考链技术,能模仿人类的思维过程,显著提升逻辑推理和复杂任务解决能力。
- 申请地址:www.tiangong.cn
- 开源地址:https://tinyurl.com/skywork-o1
此次发布的 Skywork o1 包括三款模型,既有回馈开源社区的开放版本,也有能力更强的专用版本:
- Skywork o1 Open:一款基于 Llama 3.1 8B 的开源模型,该模型在同生态位开源模型中评测指标大幅提升达到 SOTA 水平,并解锁了许多轻量级模型无法解决的复杂数学任务。
- Skywork o1 Lite:该模型具备完整的思考能力,具有更好的中文支持和更快的推理和思考速度。在数学、中文逻辑和推理类问题上表现突出。
- Skywork o1 Preview:这款模型是本次完整版的推理模型,搭配自研的线上推理算法,对比 Skywork o1 Lite 有着更多样和“深度”的思考过程,更完善和更高质量的推理。
Skywork o1 模型以其独特的慢思考推理能力脱颖而出。与当前市场上基于OpenAI o1模型的复现工作不同,Skywork o1 不仅在输出结果上展现了深度的思考、规划及自我反省能力,而且在标准测试集中的表现远超常规模型,实现了推理性能的显著提升。
Skywork o1 的实战效果如何?
图:在比较 13.8 与 13.11 孰大孰小时,Skywork o1 Lite 给出了完整的思维链路,找出解题的关键在于小数位大小。
图:在求解组合(从 10 人中选出 3 人组成一队,共多少种选择)问题时,Skywork o1 Preview 在全链路思考过后,答案正确。
欢迎各位关注我的个人微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。
