本文是LLM系列文章,针对《eCeLLM: Generalizing Large Language Models for E-commerce
from Large
eCeLM:从大规模、高质量的指令数据中概括电子商务的大型语言模型
摘要
尽管在开发有效的电子商务模型方面付出了巨大努力,但传统的电子商务模式在广义电子商务建模方面的成功有限,并且在新用户和新产品方面表现不佳——这是一个典型的领域外泛化挑战。同时,大型语言模型(LLM)在泛化建模和领域外泛化方面在许多领域都表现出了卓越的性能。为了充分释放他们在电子商务中的力量,在本文中,我们构建了ECConstruction,这是第一个开源、大规模、高质量的电子商务基准指令数据集。利用ECInstruct,我们通过指令调优通用LLM来开发eCeLLM,这是一系列电子商务LLM。我们的综合实验和评估表明,eCeLLM模型在域内评估中大大优于基线模型,包括最先进的GPT-4和最先进的特定任务模型。此外,eCeLLM对域外环境表现出极好的可推广性,包括看不到的产品和看不见的指令,突出了其作为通用电子商务模型的优势。ECInstruct数据集和eCeLLM模型在为电子商务提供多功能、有效的LLM方面都显示出巨大的潜力。ECInstruct和eCeLLM模型可通过https://ninglab.github.io/eCeLLM开放访问。