本文是LLM系列文章,针对《Towards Trustable Language Models: Investigating Information Quality of Large Language Models》的翻译。
走向可信任的语言模型:大型语言模型的信息质量研究
摘要
大型语言模型(LLM)正在快速生成信息,要求用户越来越依赖和信任数据。尽管LLM取得了显著的进步,但由于信息质量方面的挑战,LLM生成的信息并不完全可信。具体而言,由于LLM预训练期间的不可靠、有偏见的标记化,信息质量的完整性降低。此外,由于信息质量下降的问题,导致了信息的幻觉、捏造。不可靠的信息可能导致企业做出有缺陷的决策,从而影响经济活动。在这项工作中,我们介绍了LLM新的数学信息质量评估,我们进一步分析并强调了信息质量的挑战,系统地缩放语言模型的缩放规律。
本文关注大型语言模型(LLM)的信息质量,指出尽管LLM取得显著进步,但其生成的信息因预训练阶段的不可靠和偏见而存在质量问题。信息的不完整性和幻觉可能导致经济决策失误。作者提出新的数学评估方法,并讨论了模型的规模、数据集、偏见和性能等挑战。
已下架不支持订阅
435

被折叠的 条评论
为什么被折叠?



