统计含有中文的行,使用jieba库分词后用词云图进行展示
一、数据来源
- 数据来源:https://tianchi.aliyun.com/competition/entrance/231715/information
- 采用了reviews_detail.csv表的数据。该表记录了短租房评论相关的内容和作者信息;
- 使用了python3.7.1,pycharm社区版2019.2。
二、数据读取
导入模块
import pandas as pd
import re
读取数据
io3 = 'D:/PythonProject/(天池)短租数据集分析/数据集-明细版/reviews_detail/reviews_detail.csv'
data = pd.read_csv(io3)
reviews_detail_df = pd.DataFrame(data)
# 提取评论内容,且需要转换成字符串类型
reviews_detail_df_c = reviews_detail_df['comments'].astype(str)
print