实验探索: ChatGPT是好的推荐系统吗?

文章通过实验评估了ChatGPT在评分预测、序列推荐、直接推荐、解释生成和评论总结等五个推荐场景的应用,显示其具备良好的通用推荐能力和泛化性能,特别是在序列推荐任务中优于传统方法。尽管如此,ChatGPT的性能仍有提升空间,未来研究将聚焦于进一步优化其在推荐任务中的表现。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


TLDR: 之前我们简单测试了下ChatGPT作为推荐器在序列推荐和可解释推荐上的能力,即如何利用ChatGPT实现推荐模型的能力?今天再跟大家分享一篇通过实验来探究ChatGPT通用推荐能力的文章,其在评分预测、序列推荐、直接推荐、解释生成和评论总结等五个推荐场景中测试了ChatGPT的推荐能力。

4bbb7b357c7f68dcdac5e751ff0f3846.png

本文介绍了一种基于ChatGPT的通用推荐模型。与传统方法不同,ChatGPT不需要针对每个任务进行专门调整,而是通过大规模语料库学习到丰富的语言和世界知识,并将其应用于各种推荐场景中。具体的,使用ChatGPT完成推荐任务的工作流程如下图所示,包括三个步骤。首先,根据推荐任务的特定特征构建不同的prompts,具体的prompts包括三部分,即任务描述、行为注入和格式指示。其次,这些prompts被用作ChatGPT的输入,根据prompts中指定的要求生成推荐结果。最后,通过改进模块检查和优化ChatGPT的输出,并将优化后的结果作为最终推荐结果返回给用户。

35253a37d466e267c02e7114cf3316f5.png

在本文中,使用了预训练好的ChatGPT模型,并通过设计一组提示语来将推荐任务转化为自然语言任务,并测试了其在zero-shot和few-shot上的推荐能力。具体来说,设计了五个不同的推荐场景,包括评分预测、顺序推荐、直接推荐、解释生成和评论总结。

  • 在评分预测任务中,要求ChatGPT根据用户的历史评分和商品信息预测用户对新商品的评分。下图展示了相应的prompt。黑色字体表示任务描述,红色字体表示格式要求,蓝色字体表示用户历史信息或few-shot信息,灰色字体表示输出结果,下同。

db7beedc483d1b6713f19b8680d50de8.png
  • 在序列推荐任务中,要求ChatGPT根据用户的历史行为和商品信息生成一个商品序列,以便向用户推荐相关商品。下图展示了相应的prompt。

aa9de766d8c56eaefb0b6eee5387496f.png
  • 在直接推荐任务中,要求ChatGPT根据用户的历史行为和商品信息直接向用户推荐相关商品。下图展示了相应的prompt。

4f9965617ac8d22deb6c5aee8b4b6295.png
  • 在解释生成任务中,要求ChatGPT根据给定的评分或行为生成一段自然语言解释。下图展示了相应的prompt。

82fd7bb5c2eac4dc7febed6892a15f57.png
  • 在评论总结任务中,要求ChatGPT根据给定的评论生成一段自然语言总结。下图展示了相应的prompt。

d0635492c7f5ef5be73af7ed6a69c66f.png

为了评估ChatGPT在各种推荐场景下的性能,使用了Amazon电子商务数据集。其中,zero-shot表示直接对ChatGPT进行测试,而few-shot则表示对ChatGPT注入用户历史交互来微调ChatGPT然后进行测试。实验结果表明,在所有五个场景下,ChatGPT都表现出差不多的推荐能力。特别地,在序列推荐任务中,ChatGPT相比于传统方法有着更好的性能。

6915431750f285a1637b7bceb2839c8c.png 20b56cf18903ac63fb8facb03e6885c2.png fb08e717883c3cfeaccd1087718dc07a.png c29877817b916727d837af12c11c5004.png 8b91a878884325c035d3f41c2f3d4ac9.png

总之,本文通过实验的方式探究了ChatGPT的通用推荐能力,它可以处理各种推荐任务,并且具有较好的泛化能力,但有待进一步提升。通过大规模语料库学习到的丰富知识可以有效地应用于推荐任务中。未来,将继续探索如何进一步提高ChatGPT在推荐任务中的性能,并将其应用于更多的领域中,以满足不同领域的推荐需求。

更多技术细节请阅读原始论文。


python+opencv简谱识别音频生成系统源码含GUI界面+详细运行教程+数据 一、项目简介 提取简谱中的音乐信息,依据识别到的信息生成midi文件。 Extract music information from musical scores and generate a midi file according to it. 二、项目运行环境 python=3.11.1 第三方库依赖 opencv-python=4.7.0.68 numpy=1.24.1 可以使用命令 pip install -r requirements.txt 来安装所需的第三方库。 三、项目运行步骤 3.1 命令行运行 运行main.py。 输入简谱路径:支持图片或文件夹,相对路径或绝对路径都可以。 输入简谱主音:它通常在第一页的左上角“1=”之后。 输入简谱速度:即每分钟拍数,同在左上角。 选择是否输程序中间提示信息:请输入Y或N(不区分大小写,下同)。 选择匹配精度:请输入L或M或H,对应低/中/高精度,一般而言输入L即可。 选择使用的线程数:一般与CPU核数相同即可。虽然python的线程不是真正的多线程,但仍能起到加速作用。 估算字符上下间距:这与简谱中符号的密集程度有关,一般来说纵向符号越稀疏,这个值需要设置得越大,范围通常在1.0-2.5。 二值化算法:使用全局阈值则跳过该选项即可,或者也可输入OTSU、采用大津二值化算法。 设置全局阈值:如果上面选择全局阈值则需要手动设置全局阈值,对于.\test.txt中所提样例,使用全局阈值并在后面设置为160即可。 手动调整中间结果:若输入Y/y,则在识别简谱后会暂停代码,并生成一份txt文件,在其中展示识别结果,此时用户可以通过修改这份txt文件来更正识别结果。 如果选择文件夹的话,还可以选择所选文件夹中不需要识别的文件以排除干扰
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值