本文是LLM系列文章,针对《Cause and Effect: Can Large Language Models Truly Understand
Causality?》的翻译。
摘要
随着大型语言模型(LLM)的兴起,了解其在破译和解释语言所包含的复杂因果关系网络方面的能力和局限性变得至关重要。目前的方法使用显性或隐性因果推理,但强烈需要一种统一的方法,将两者结合起来,以更有效地处理广泛的因果关系。本研究提出了一种新的架构,称为上下文感知推理增强与反事实分析(CARE-CA)框架,以增强因果推理和可解释性。所提出的框架结合了具有ConceptNet和反事实陈述的显式因果检测模块,以及通过LLM的隐式因果检测。我们的框架更进一步,提供了一层反事实的解释,以强调LLM对因果关系的理解。ConceptNet的知识增强了多个因果推理任务的性能,如因果发现、因果识别和反事实推理。反事实句增加了“非由”情景的明确知识。通过结合这些强大的模块,我们的模型旨在提供对因果关系的更深入理解,从而增强可解释性。对基准数据集的评估显示,所有指标的性能都有所提高,如准确性、精确度、召回率和F1分数。我们还引入了CausalNet,这是一个新的数据集,伴随着我们的代码,以促进该领域的进一步研究。