Constrained-Text-Generation-Studio:创意文本生成的利器

Constrained-Text-Generation-Studio:创意文本生成的利器

Constrained-Text-Generation-Studio Code repo for "Most Language Models can be Poets too: An AI Writing Assistant and Constrained Text Generation Studio" at the (CAI2) workshop, jointly held at (COLING 2022) Constrained-Text-Generation-Studio 项目地址: https://gitcode.com/gh_mirrors/co/Constrained-Text-Generation-Studio

项目介绍

Constrained-Text-Generation-Studio(CTGS)是一款面向休闲语言学者、诗人、创意作家以及研究人员的AI写作助手。它旨在探索和利用大规模语言模型生成受限制文本的能力。CTGS允许用户生成或选择具有各种约束条件的文本,例如禁止特定字母的出现、强制生成的单词具有特定音节数、以及强制单词是另一个单词的部分字母重组等。

项目技术分析

CTGS的核心技术在于其独特的算法。在生成过程中,语言模型实际上是从其整个词汇库的概率分布中进行采样。与微调方法相比,CTGS通过在采样步骤之前禁止违反所选约束的词汇,确保模型不会违反所施加的约束。这种方法在受限制的写作数据集上,相比微调方法,能够产生更低的困惑度,从而生成更高质量的文本。

CTGS支持任何在Huggingface平台上可用的语言模型,并计划支持遮蔽语言模型以及文本到文本的模型。项目的贡献包括数据集、Huggingface "space" webapp Gadsby,以及相关论文《Most Language Models can be Poets too: An AI Writing Assistant and Constrained Text Generation Studio》。

项目技术应用场景

CTGS的应用场景广泛,适用于以下领域:

  1. 创意写作:诗人可以使用CTGS来创作特定音节、韵律或字母限制的诗歌。
  2. 语言学研究:语言学者可以探索语言模型在不同约束条件下的表现,以了解语言结构和生成规律。
  3. 文本生成:创意作家可以生成具有特定风格或主题的文本,为创作提供灵感。
  4. 辅助教学:教师可以利用CTGS来设计有趣的写作练习,帮助学生提高语言表达和创造力。

项目特点

CTGS具有以下显著特点:

1. 高度可定制化的约束

CTGS提供了21种过滤器,这些过滤器可以自由组合,以实现各种复杂的约束条件。这些过滤器包括:

  • Lipograms:避免使用特定的字母或字符串。
  • String In Position:强制特定字母出现在字符串的特定位置。
  • Rhyme:返回与给定字符串押韵的字符串。
  • Palindrome:生成回文字符串。
  • Anagram:生成另一个字符串的字母重组。
  • Isogram:确保字符串中的字符不超过特定次数。

2. 文本转换

CTGS提供了12种文本转换功能,以适应不同语言模型的词汇库特点。这些转换包括:

  • Uppercase transform:将所有文本转换为大写。
  • Lowercase transform:将所有文本转换为小写。
  • Remove spaces:去除所有空格。
  • Capitalize the first letter:首字母大写。

3. 未来的发展方向

CTGS的开发者计划添加更多功能,如利用Huggingface的内置Logitsprocessor类来加速生成过程、支持序列级约束、调整token/logit概率等,以进一步提高项目的实用性和灵活性。

总之,Constrained-Text-Generation-Studio是一个功能强大、应用广泛的开源项目,无论是对于创意写作、语言学研究,还是文本生成领域,都具有极高的使用价值。通过其独特的约束文本生成能力,CTGS无疑将成为创意文本生成领域的亮点工具。

Constrained-Text-Generation-Studio Code repo for "Most Language Models can be Poets too: An AI Writing Assistant and Constrained Text Generation Studio" at the (CAI2) workshop, jointly held at (COLING 2022) Constrained-Text-Generation-Studio 项目地址: https://gitcode.com/gh_mirrors/co/Constrained-Text-Generation-Studio

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

庞燃金Alma

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值