本文是LLM系列文章,针对《Large Language Model-driven Meta-structure Discovery in Heterogeneous Information Network》的翻译。
摘要
近十年来,异构信息网络(HIN)因其能够捕捉不同类型节点之间的复杂关系而越来越受欢迎。提出了元结构来识别HIN上的重要关系模式,这已被证明对从HIN中提取丰富的语义信息和促进图神经网络学习表达表示是有效的。然而,手工制作的元结构对扩展到大型复杂的HIN提出了挑战,这引起了开发自动元结构搜索算法的广泛研究关注。以前的工作主要集中在搜索具有良好经验预测性能的元结构,而忽略了所发现的元结构的可解释性。因此,它们经常产生复杂的元结构,这些结构容易过度拟合,人类研究人员无法理解。为了应对这一挑战,我们从大型语言模型(LLM)的涌现推理能力中汲取灵感。在本文中,我们提出了一种新的推理元结构搜索(ReStruct)框架,该框架将LLM推理集成到元结构搜索的进化过程中。ReStruct使用语法翻译器将元结构编码为自然语言句子,并利用LLM的推理能力来评估语义上可行的元结构。此外,ReStruct还采用了面向性能的进化操作。这两种相互竞争的力量使ReStruct能够联合优化元结构的语义可解释性和经验性能。最后,我们还设计了一个差分LLM解释器,它可以对发现的元结构