Python程序写诗【训练1分钟】古诗生成

最新推荐文章于 2024-04-27 22:51:26 发布

原创最新推荐文章于 2024-04-27 22:51:26 发布 · 1.8w 阅读

76 ·

CC 4.0 BY-SA版权

自然语言处理专栏收录该内容

25 篇文章

订阅专栏

介绍了一种使用AI进行诗词创作的方法，通过训练词向量模型，能够快速生成不同风格的古诗词，包括五言绝句、七言绝句和对联。

原创AI程序写诗：训练 一分钟，诗词一秒成！

先看看写出来什么诗~
在这里插入图片描述

文章目录

来看看程序
语料下载地址
关于程序的一些基础
更多诗词创作

来看看程序

from gensim.models import Word2Vec  # 词向量
from random import choice
from os.path import exists
from warnings import filterwarnings
filterwarnings('ignore')  # 不打印警告


class CONF:
    path = '古诗词.txt'  # 语料路径
    window = 16  # 滑窗大小
    min_count = 60  # 过滤低频字
    size = 125  # 词向量维度
    topn = 14  # 生成诗词的开放度
    model_path = 'word2vec'  # 模型路径


class Model:
    def __init__(self, window, topn, model):
        self.window = window
        self.topn = topn
        self.model = model  # 词向量模型
        self.chr_dict = model.wv.index2word  # 字典

    """模型初始化"""
    @classmethod
    def initialize(cls, config):
        if exists(config.model_path):
            # 模型读取
            model = Word2Vec.load(config.model_path)
        else:
            # 语料读取
            with open(config.path, encoding='utf-8') as f:
                ls_of_ls_of_c = [list(line.strip()) for line in f]
            # 模型训练和保存
            model = Word2Vec(ls_of_ls_of_c, config.size,
                             window=config.window, min_count=config.min_count)
            model.save(config.model_path)
        return cls(config.window, config.topn, model)

    """古诗词生成"""
    def poem_generator(self, title, form):
        # list_of_tuples --> list_of_strings 并过滤标点符号
        filter = lambda lst: [t[0] for t in lst if t[0] not in ['，', '。']]
        # 标题补全
        if len(title) < 4:
            if not title:
                title += choice(self.chr_dict)
            for _ in range(4 - len(title)):
                chrs = self.model.similar_by_word(title[-1], self.topn // 2)
                chrs = filter(chrs)
                char = choice([c for c in chrs if c not in title])
                title += char
        # 文本生成
        seq = list(title)
        for i in range(form[0]):
            for _ in range(form[1]):
                chrs = self.model.predict_output_word(
                    seq[-self.window:], max(self.topn, len(seq) + 1))
                chrs = filter(chrs)
                char = choice([c for c in chrs if c not in seq[len(title):]])
                seq.append(char)
            seq.append('，' if i % 2 == 0 else '。')
        # 返回标题+主体
        length = form[0] * (form[1] + 1)
        title = '《%s》' % ''.join(seq[:-length])
        poem = ''.join(seq[-length:])
        return title + '\n' + poem


def main(config=CONF):
    form = {'五言绝句': (4, 5), '七言绝句': (4, 7), '对联': (2, 9)}
    m = Model.initialize(config)
    while True:
        title = input('输入标题：').strip()
        try:
            poem = m.poem_generator(title, form['五言绝句'])
            print('\033[031m%s\033[0m' % poem)  # red
            poem = m.poem_generator(title, form['七言绝句'])
            print('\033[033m%s\033[0m' % poem)  # yellow
            poem = m.poem_generator(title, form['对联'])
            print('\033[036m%s\033[0m' % poem)  # purple
            print()
        except:
            pass


if __name__ == '__main__':
    main()

语料下载地址

https://gitee.com/arye/dl/tree/master/NLP/gensim%E6%96%87%E6%9C%AC%E7%94%9F%E6%88%90

关于程序的一些基础

猛戳→gensim词向量基础

52 条评论

小基基o_O 2022.06.07
写诗2022版，含部署说明：https://gitee.com/arye/poem

小松公子 2021.12.12
请问有具体的文档吗？
- 小基基o_O回复小松公子 2021.12.12
  什么文档？需求文档？使用文档？还是其它

酿豆腐超级好吃 2021.09.01
TypeError: Both corpus_file and corpus_iterable must not be provided at the same time,请问一下这个错误是什么意思呢
- 小基基o_O回复酿豆腐超级好吃 2021.09.13
  通常是参数差异，好多报错是参数名不对，很容易改好的，但是好多人却不会改
- 酿豆腐超级好吃回复小基基o_O 2021.09.13
  版本不同，容易出问题吗？差异很大吗
- 小基基o_O回复酿豆腐超级好吃 2021.09.01
  除了看源码，提供第二种解决方式，就是把你的gensim版本弄成和我代码的一样
- 小基基o_O回复酿豆腐超级好吃 2021.09.01
  参数问题，要学会自己看源码，因为gensim这个框架经常改参数，我看各种评论报错都看到吐血。

小基基o_O 2021.06.20
新代码，测试可行：https://download.youkuaiyun.com/download/Yellow_python/19746028
- 小基基o_O回复小基基o_O 2022.06.03
  真tm吐血，gensim又tm改版

DaveBobo 2021.03.30
提示错误： TypeError: __init__() got an unexpected keyword argument 'size' 需要怎么解决？
- 十小大回复DaveBobo 2021.05.19
  上面博主回复的第35行中的参数size改为vector_size，这是由于Gensim版本更新后导致的不同

after_the_rain17 2020.12.14
作为一个python小白，在这儿不得不说LZ nb！
- 小基基o_O回复after_the_rain17 2020.12.14
  🤝

AI学习的猫先生 2020.12.01
请问博主一直显示FileNotFoundError: [Errno 2] No such file or directory: '古诗词.txt'是什么情况该怎么解决呢谢谢
- 小基基o_O回复AI学习的猫先生 2020.12.02
  😂py和txt放同一个文件夹就行了😂，用【pycharm】运行就会少很多报错
- AI学习的猫先生回复小基基o_O 2020.12.02
  删除了 try 和except模块的有关内容 35行也更改了还是显示没用古诗词.txt
- 小基基o_O回复AI学习的猫先生 2020.12.02
  看其它评论，以及去掉【try except】
- AI学习的猫先生回复小基基o_O 2020.12.01
  已下载了可是还是不行...
- 小基基o_O回复AI学习的猫先生 2020.12.01
  缺少文件【古诗词.txt】，文中已经注明下载地址

North Hour 2020.04.30
我一个月没动，就报错了...... pydev debugger: process 14084 is connecting 注:每一次debug检查过的数字都不一样(我看过评论区了，55555，没有) 感谢回复
- 小基基o_O回复North Hour 2020.04.30
  [reply]NorthHour[/reply]本人建议【重装pycharm或你的开发工具】。而百度找到的建议是：https://blog.youkuaiyun.com/hfutdog/article/details/82690454