自勉

 

 

淡泊明志 宁静致远

 

 

上善若水 厚德载物

 

import os from gensim import corpora, models # ### 1LDA # 文件路径规范化 file_path = os.path.normpath(r"E:/bert/LDA/NLP_word.txt") # 读取数据 corpus = [] dictionary = corpora.Dictionary() with open(file_path, 'r', encoding='utf-8') as f: for line in f: words = [word for word in line.strip().split() if word] if words: # 跳过空行 dictionary.add_documents([words]) corpus.append(dictionary.doc2bow(words)) # 训练LDA模型 lda_model = models.LdaModel( corpus=corpus, id2word=dictionary, num_topics=6, passes=15, random_state=100 ) # 输出主题 for idx, topic in lda_model.print_topics(): print(f"主题#{idx}: {topic}") # ### 2可视化 # In[29]: import pyLDAvis import pyLDAvis.sklearn # In[31]: pic = pyLDAvis.sklearn.prepare(lda, tf, tf_vectorizer) #pyLDAvis.display(pic) pyLDAvis.save_html(pic, 'lda_pass'+str(n_topics)+'.html') #pyLDAvis.display(pic) #去工作路径下找保存好的html文件 #和视频里讲的不一样,目前这个代码不需要手动中断运行,可以快速出结果 D:\anaconda3\python.exe E:/bert/LDA/LDA_test.py Traceback (most recent call last): File "E:\bert\LDA\LDA_test.py", line 36, in <module> import pyLDAvis ModuleNotFoundError: No module named 'pyLDAvis' 主题#0: 0.003*"赐封" + 0.003*"花" + 0.003*"叠石溪" + 0.003*"夫妇" + 0.003*"鼎甲" + 0.003*"金口玉言" + 0.003*"丹墀" + 0.003*"藻井" + 0.003*"孔孟" + 0.003*"义" 主题#1: 0.004*"旌" + 0.004*"闽北书院" + 0.004*"程门" + 0.004*"霞" + 0.004*"自勉" + 0.004*"三株" + 0.004*"莅" + 0.004*"严翼" + 0.004*"岭南书院" + 0.004*"康熙二十年" 主题#2: 0.004*"会善寺" + 0.004*"二将军" + 0.004*"建" + 0.004*"九经" + 0.004*"康熙二十一年" + 0.004*"读书" + 0.004*"廪生" + 0.004*"明嘉靖" + 0.004*"兴" + 0.004*"程朱理学" 主题#3: 0.004*"雅" + 0.004*"祼奠" + 0.004*"诚" + 0.004*"向" + 0.004*"祼" + 0.004*"张载" + 0.004*"耿逸庵" + 0.004*"析理" + 0.004*"嵩阳观" + 0.004*"难" 主题#4: 0.004*"宸翰" + 0.004*"洛学" + 0.004*"始" + 0.004*"主敬穷理" + 0.004*"忠孝节义" + 0.004*"肄业" + 0.004*"汉" + 0.004*"诘" + 0.004*"廊庑" + 0.004*"鸢飞鱼跃" 主题#5: 0.003*"烟霞" + 0.003*"彼废彼兴" + 0.003*"朱甍" + 0.003*"欧阳修" + 0.003*"黝垩" + 0.003*"旧址" + 0.003*"讲会录" + 0.003*"碑记" + 0.003*"天晴日朗" + 0.003*"蒸云沛雨" 进程已结束,退出代码1
最新发布
11-05
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值