平台及工具
语言:python
平台:anaconda+jupyter notebook
语料库:近三百篇英文文献的摘要
主要代码
首先,# pandas处理csv数据
import pandas as pd
df = pd.read_csv("abs_all.csv",error_bad_lines=False,encoding='gb18030')
df.head()
输出:

文本预处理
def lemmatize_stemming (text):
# 词形归并
wordnet_lematizer = WordNetLemmatizer()
word = wordnet_lematizer.lemmatize(text)
return word
def preprocess(text):
result = []
for token

本文介绍了一种使用Python和Anaconda进行英文文献摘要的主题挖掘方法。通过预处理文本、提取特征和应用LDA算法来发现潜在主题。此外,还展示了如何可视化结果并解释关键参数。
最低0.47元/天 解锁文章
1704

被折叠的 条评论
为什么被折叠?



