探索书生大模型能力边界
1. InternThinker 介绍
InternThinker 是一个强推理模型,具备长思维能力,并能在推理过程中进行自我反思和纠正,从而在数学、代码、推理谜题等多种复杂推理任务上取得更优结果。相应的,模型生成回复的时间也会变长,本节课我们将来一起探索一下 InternThinker 的能力边界。
2. 任务
任务一
InternThinker 挑战 LeetCode, 在LeetCode 使用 InternThinker 刷 5 道算法题,使用 InternThinker 生成答案提交至 100% 通过。
任务二
选择到 5 道您对题目答案有把握的且在互联网社交媒体上尽可能没出现过的 puzzle 推理题(您所在专业题目、面试代码题、逻辑思维题、行测找规律问题、高等数学题、奥赛题等等,请勿使用 leetcode 的题目) 考倒 InternThinker:让 InternThinker 生成错误的回复。
作业链接:https://lvh7el0ujt.feishu.cn/docx/XYOYdUpxkozuIXxhIvZctIWGnnf