人工智能:现状、挑战与机遇
1. 人工智能的必然性与语言局限性
人工智能已成为我们生活中不可分割的一部分,它是过去五十多年来数字化和计算技术发展的自然延伸。它不太可能是一场有明确时间节点的“革命”,而是会以渐进的方式让许多行业受益。然而,人工智能不仅仅是技术层面的问题,它对社会有着深远的影响。
人们常常为了便利而牺牲自己的一些重要资产,如金钱、隐私和个人成长。人工智能确实能让生活变得更轻松,例如使用基于人工智能的聊天机器人获取新闻摘要。但我们需要思考摘要的标准、偏差以及谁来定义这些偏差。以ChatGPT为例,用于训练的约45TB文本中,超过90%是英文。尽管英语在开源资源中广泛使用,但全球80亿人口中,只有约3.8亿人以英语为母语,这意味着当前最大的“人工智能”语言模型未能真正代表大多数人口。
语言不仅仅是交流的工具,它还是概念的一种表达方式。不同语言的词汇数量差异很大,例如韩语有超过100万个单词,日语有50万个,意大利语有26万个,英语有17万个。每个单词都代表一个概念,这些概念通过文化和社会共识赋予意义,帮助人们交流和传达复杂的思想、情感和经验。
缺乏表达特定概念的词汇会导致难以准确有效地表达该概念,进而引发误解和缺乏共同理解。同时,词汇的缺乏也会限制人们对某些概念的思考和推理能力。目前像GPT这样的模型,缺失了大量非英语语言来源中蕴含的知识。填补这一差距并非易事,将不同语言整合在一起是个难题。虽然将所有语言翻译成一种语言是一种可能的解决方案,但翻译过程中可能会丢失一些信息,而且需要一个基于机器的系统,涉及数百万份文档的翻译。尽管翻译算法在不断改进,但在覆盖大量语言时,准确性仍然不足。
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



