- 博客(3)
- 收藏
- 关注
原创 图片类word报告生成器
由于最近需要收集同伴们的核酸检测报告,做成word文档提交,就写了一个程序。本代码推荐使用jupyter notebook打开。输入数据:图片文件,图片文件命名需为“姓名+其他字段”。输出要求格式:姓名+固定词(例如:李华核酸检测报告),后填对应图片。结果示例如下:需要用到的工具包pip install os #使用 os 工具包读取文件名称pip install python-docx # 使用python-docx制作word文档p
2022-05-02 15:15:53
2643
原创 利用Word2Vec在语料中构建种子词集同类词
nlp小白努力探索的第n天......今天记录和分享利用gensim.model.word2vec.Word2Vec在语料中构建种子词集同类词先说明任务情况:全量语料数据中包含:已打标语料,未打标语料。从已打标语料中提取出关键词,我们将这部分词汇成为种子词集。现需要从全量语料数据中找到种子词集的同类词。步骤:1)对语料库建立word2vec词向量模型;2)利用 gensim.model 联动的词汇相似度计算方法,以种子词集作为研究对象在语料库中找出同类词。数据展示:文件名:u
2022-04-06 17:28:44
4237
1
原创 使用gensim.models.word2vec.LineSentence之前的语料预处理
nlp小白摸爬滚打的叨叨叨记录在进行自然语言处理工作时,不可避免使用大型语料库。在这里记录并分享做自己实验的时候读函数文档,以及参考各路大神,终于明白LinSentence如何使用的历程。函数文档链接:models.word2vec – Word2vec embeddings — gensim(课题师兄说使用库的时候尽量看库文档)LinSentence 函数在使用之前需要对待处理的文本数据进行分词,并以空格分隔;函数在运行时,按行读取已经以空格分隔的文档。以下是实验代码导..
2022-04-06 10:41:57
5615
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人