文本信息挖掘之词云、LDA主题模型——排名在前 1% 的高中生是靠天赋还是靠努力?(知乎)
最近各地的高考成绩刚出,看到各地状元那神仙般的成绩,不由得让我想起知乎上一个一直热度不减的问题——“排名在前 1% 的高中生是靠天赋还是靠努力?”
借着上次爬知乎的代码(链接: link.),简单爬了1000多条数据。
数据的链接在这里:
接下来,就用LDA主题模型来简单探究一下吧!
导包
import pandas as pd
import re
import jieba
import matplotlib.pyplot as plt
from wordcloud import WordCloud
fr
原创
2020-07-30 21:18:53 ·
1284 阅读 ·
2 评论