很多人总是用数学题、事实幻觉、思维推理等问题测试LLM,太过麻烦或刁难了。
既然LLM是大语言模型,还是先做好最基础的语言理解能力测试吧。
来试试下面的简单句子,你常用的LLM能正确理解翻译几个?
先看看LLM一般都能正确理解的几个句子作为参照,但是重点却在第二张图片:)

挑战来了! 注意一定要新开一个对话窗口,排除上下文的影响:)

智能没有明确的定义,智能是一种概率性容错,困难在于,既要容错又要知错!
若有兴趣更多内容请参考针对LLM大语言模型理解能力的判决性检验2
很多人总是用数学题、事实幻觉、思维推理等问题测试LLM,太过麻烦或刁难了。
既然LLM是大语言模型,还是先做好最基础的语言理解能力测试吧。
来试试下面的简单句子,你常用的LLM能正确理解翻译几个?
先看看LLM一般都能正确理解的几个句子作为参照,但是重点却在第二张图片:)

挑战来了! 注意一定要新开一个对话窗口,排除上下文的影响:)

智能没有明确的定义,智能是一种概率性容错,困难在于,既要容错又要知错!
若有兴趣更多内容请参考针对LLM大语言模型理解能力的判决性检验2

被折叠的 条评论
为什么被折叠?