1.ImportError: Missing optional dependency 'openpyxl'. Use pip or conda to install openpyxl.
需要安装 openpyxl
库才能读取 .xlsx
文件。
pip install openpyxl
2.[nltk_data] Error loading stopwords: [WinError 10060]
nltk
库下载停用词时出现网络连接问题。
检查网络连接,或更换镜像源(实际上再试一次就好了,好奇怪)。
【尚未解决】3. 怎样确定最优主题数。
计算不同主题数下的困惑度,选择困惑度最低的主题数。
采用随机种子每次最优的都不一样,还是不好确定,最后多试了几次选了最多的。
4.pyLDAvis
可视化时的问题。
TypeError: drop() takes from 1 to 2 positional arguments but 3 were given
AttributeError: module 'pyLDAvis' has no attribute 'gensim'
安装1.3.3版本的pandas 和 3.1.1版本的pyLDAvis
参考LDA模型用pyLDAvis进行可视化遇到的问题及解决方法_typeerror: drop() takes from 1 to 2 positional arg-优快云博客
5.
可视化结果HTML 文件打开页面却空白。
将文件中的cdn全部改成fastly
参考LDA结果可视化 html空白不显示内容 解决笔记_lda 可视化网页不显示-优快云博客
6.尝试安装旧版本的 pandas
时遇到卸载现有版本的问题。
强制删除也失败,后面手动找到包删除的