目录
一、引入
2025年2月,如果不是长期从事人口研究的中国人民大学教授李婷的公开辟谣,很多人都真诚地相信了一组数据——“中国80后累计死亡率为5.20%”。
在社交媒体上,许多“80后”都曾因这组数据扼腕叹息。“截至2024年末,80后的死亡率已经超过70后,相当于每20个80后中,就有1人已经去世。”自媒体传播道。
这一说法很快露馅。李婷教授在受访时表示:“(死亡率5.2%)错误非常明显,因为专业统计数据中死亡率会用千分率表示,而不是百分率。”她指出,国家统计局并未公布2024年的死亡率,也不会根据“80后”、“90后”等分段公布死亡人数,因此这一说法毫无数据支撑。
二、数据
近日,AI学会造假数据已冲上热搜榜第一,这种现象也被成为“幻觉(hallucination)”。
下图为截止至2025年2月28日的Vectara大模型幻觉测试排行榜
三、如何辨别AI是否在胡说八道呢?
有来源可信度、逻辑合理性、信息一致性、数据支持、使用水印方案、明确需求、设定范围、要求解释、提供示例、纠正错误等方法辨别AI胡说八道。
来源可信度
在信息时代,我们应该注重消息的来源。如果AI机器人的回答来自权威媒体、学术机构或公认专家,那么这些言论很可能是真实可信的1。
逻辑合理性
AI机器人的回答是否符合逻辑和常识也是一个判断依据。如果AI的回答自相矛盾、荒谬可笑,或者与我们的基本常识相悖,那么它很可能是在胡说八道。我们可以多加思考、与他人讨论,并通过比较不同来源的意见来验证AI的言论1。
信息一致性
当我们多次向AI机器人提问同一个问题时,如果它的回答在不同场合下保持一致,那么这些言论更有可能是真实可信的1。
数据支持
AI的回答是否能够提供相关的数据支持也是我们判断其真实性的依据。如果AI给出了具体的数据、研究结果或者实证案例,我们可以通过查证这些数据的来源和真实性来验证其言论的可信度1。
使用水印方案
文本水印方案可以提高AI生成文本的检测精度。在扭曲和非扭曲设置下,与现有的最佳方法相比,SynthID-Text都提升了水印的检出率2。
明确需求
在与AI对话之前,我们应该明确自己的需求,并清楚地表达出来。通过具体和明确的提示词,我们可以引导AI机器人更加精准地理解我们的意图1。
设定范围
为了避免AI在很宽泛的范围内进行回答,导致不太准确或模糊的结果,我们可以在提示词中设定一个明确的范围或限定条件。例如,我们可以使用请给出过去五年内的数据或者限定在某个领域/地区/时间段内回答等提示词,以便让AI机器人针对特定范围给出更加精准和可靠的答案1。
要求解释
有时候,AI的回答可能过于简洁或晦涩,不太容易理解。例如,我们可以用类似于请解释一下你的思路/依据是什么或者为什么你认为如此的提示词,以便促使AI给出更加具体和理由充分的回答1。
提供示例
为了避免AI胡说八道,我们可以在提示词中提供一些具体的例子或参考资料,以方便AI更好地理解我们的需求和期望。例如,我们可以使用类似于XX的例子或者请参考某个权威机构发布的报告等提示词,以便让AI基于真实、可信的信息给出回答
1。
纠正错误
如果我们发现AI输出了不准确或胡说八道的内容,我们可以立即纠正并明确表达我们的期望1。
以上方法可以帮助我们更好地辨别AI是否在胡说八道。需要注意的是,即使是最先进的AI技术,也可能存在误导或错误的情况。因此,我们应该保持批判思维,用健康的怀疑精神对待AI的言论,并主动寻求多方面的信息来源和意见,从而获取全面客观的知识。