Can Language Models Make Fun? A Case Study in Chinese Comical Crosstalk

最新推荐文章于 2025-11-25 12:11:01 发布

UnknownBody

最新推荐文章于 2025-11-25 12:11:01 发布

阅读量618

点赞数

CC 4.0 BY-SA版权

文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/c_cpp_csharp/article/details/133867506

LLM 日更专栏收录该内容

828 篇文章

已下架不支持订阅

本文探讨了预训练语言模型在生成中国相声（一种喜剧形式）方面的表现，建立了一个大规模的相声剧本数据集，并评估了多种NLG方法。尽管大规模预训练提升了生成质量，但与人类创作相比仍有显著差距。未来研究将涉及相声的口音适应以促进端到端生成。

本文是LLM系列文章，针对《Can Language Models Make Fun? A Case Study in Chinese Comical Crosstalk》的翻译。

语言模型能制造乐趣吗?中国滑稽相声个案研究

摘要
1 引言
2 问题定义
3 数据集
4 使用自动评估生成基准
5 人工评估
6 讨论
7 结论与未来工作

摘要

语言是人类交流的主要工具，幽默是其中最具吸引力的部分之一。像人类一样使用计算机生成自然语言，也就是自然语言生成(NLG)，已被广泛用于对话系统、聊天机器人、文本摘要以及人工智能生成内容(AIGC)，例如创意生成和脚本编写。然而，自然语言的幽默方面的研究相对较少，特别是在预训练语言模型的时代。在这项工作中，我们的目的是初步测试NLG是否能像人类一样产生幽默。我们建立了由大量中国滑稽相声剧本(简称c3)组成的最大数据集，这是自19世纪以来中国流行的表演艺术“相声”或“相声”。我们对各种生成方法进行基准测试，包括从头开始训练Seq2seq，微调的中等规模plm，以及带和不带微调的大规模plm。此外，我们还进行了人工评估，结果表明:1)大规模预训练大大提高了相声生成的质量;2)即使是最好的PLM生成的脚本也远远达不到我们的期望。我们得出结论，使用大规模plm可以极大地改善幽默生成，但它仍处于起步阶段。数据和基准测试代码可在https://github.com/ anonNo2/crosstalk-generation中公开获得。

1 引言

2 问题定义

3 数据集

4 使用自动评估生成基准

5 人工评估

6 讨论

了解本专栏

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。