
2020_6_任务_总结
Seepen_L
一个人必须不停地写作,才能不被茫茫人海湮灭。
展开
-
pyecharts丨页面布局工具——Page 和 Grid
让多张图表展示在同一页面一、 令图表垂直布局——Page二、 令图表水平布局——GridP.S. 如何让两个饼图平行排列?P.P.S. 如何让两张纯图片平行排列?P.P.P.S 如何让两个词云水平排列?比如我想达到的效果图是这样:就要用到pyecharts中的page和grid布局。其中page帮助我们将多个模块垂直组合到一个页面中,grid帮助我们将多个单元素(图、表、overlap、图片)水平或垂直并列布局。先从相对简单的page说起。一、 令图表垂直布局——Page首先import类原创 2020-07-06 17:12:42 · 24236 阅读 · 9 评论 -
LDA模型中文文本主题提取丨可视化工具pyLDAvis的使用
主题模型LDA的实现及其可视化pyLDAvis1. 无监督提取文档主题——LDA模型1.1 准备工作1.2 调用api实现模型2. LDA的可视化交互分析——pyLDAvis2.1 安装pyLDAvis2.2 结合gensim调用api实现可视化p.s. 保存结果为独立网页p.p.s. 加快prepare速度?2.3 如何分析pyLDAvis可视化结果2.3.1. **每个主题表示什么意义?**2.3.2 每个主题有多么普遍?2.3.3 主题之间有什么关联?1. 无监督提取文档主题——LDA模型这个模型原创 2020-07-05 17:04:16 · 60047 阅读 · 96 评论 -
pyecharts丨页面布局工具——grid注意事项和overlap的使用
grid使用注意事项使用grid时,一般情况下,永远不要先给grid加入一个没有x y轴的图,比如饼图、地图等等。当然,两个饼图如何用grid设置为平行我前面也写过了。这里想注意的是一个饼图、一个柱状图平行放置时的情况。比如,你想实现左边饼图,右边柱状图,而如果你先把饼图加进来:# c1是个pie,c9是个bargrid3_1.add(c1, grid_opts=opts.GridOpts(pos_right="55%"))grid3_1.add(c9, grid_opts=opts.GridO原创 2020-07-04 13:14:43 · 16557 阅读 · 6 评论 -
pyecharts丨将主题的演变嵌入时间长河中——主题河流图
主题河流图终于是好像比较高级的图了hhhh但其实早在2008年都有比较出色的运用了,2008年2月,《纽约时报》发布了一个最典型、最著名的河流图的例子《电影的衰退和流动:过去20年的电影票房收入》,描述了从1986年1月到2008年2月期间,所有电影的上映时间以及期间的周票房变化。在这个河流图中,流形状的宽度代表了某部电影的周票房,流形状的起始是由电影的上映时间决定的。颜色由电影的总票房决定,票房就是电影的“附加定量”,颜色越深代表了电影最终票房越高。那么应该怎么去看这个看上去花里胡哨的河流图呢原创 2020-07-03 20:14:08 · 10015 阅读 · 2 评论 -
pyecharts丨关于热力图Heatmap
首先说明本篇讲述的是这个Heatmap。情景描述: 将用户行为放到与周几和具体几点挂钩的层面上展示。具体的讲解放注释里了。codedef heatTime_mi(): from pyecharts.charts import HeatMap import numpy as np # 关于时间格式的数据预处理这些放到另一篇文章里详述了 data = pd.read_csv('data/mi10_user_weibo_time_list.txt', encoding=原创 2020-07-03 12:59:30 · 10972 阅读 · 3 评论 -
python使用pandas和datetime处理时间格式
问题场景:爬虫爬取用户微博的发布时间,保存在csv中。保存格式为2020-01-01 10:10现需要分别提取 年 月 日 时间 做分析;同时已知年月日,希望得到该日是周几。codeimport pandas as pdfrom datetime import datetimet = pd.read_csv('mi10_user_publish_time.txt', encoding='utf-8')# txt中第一行有表头pubtime,所以才有下一行。若文件中每行为纯数据,则直接原创 2020-07-03 09:53:30 · 829 阅读 · 0 评论