
数据分析及可视化
文章平均质量分 99
主要介绍Python数据分析及可视化
warm...
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python词云分析之名著词云分析
看了嵩天老师的《python编程新思维及实战》的课程后,看词云分析挺有意思的,自己也想试试词云分析,所以就爬取了西游记,聊斋志异,红楼梦,三国演义四部图书,存放为txt文件格式,以供分析。 代码如下: # 导入词云库 import wordcloud # 导入jieba库,做分词使用 import jieba # 需要分析的文本 txt = "聊斋志异.txt" # 打开需要分析的文本,爬取的格...原创 2020-03-25 18:09:26 · 3569 阅读 · 2 评论 -
python之jieba库的使用,快速分词,词云必备
jieba库的三种分词模式 精确模式:将文本精确地切开,分词后无冗余,适合文本分词,最常用的分词模式。 全模式:把文本中所有可能成词的词语都扫描出来,速度快,不能解决歧义。 搜索引擎模式:在精确模式的基础上,对长词再次切分,提高回召回率。 jieba.cut(s) ...原创 2020-03-25 18:32:54 · 2398 阅读 · 0 评论 -
python之wordcloud库的使用,快速简单上手,制作属于你的词云
wordcloud库是展示文本信息的重要的库,是python中非常好的用于展示词云的第三方库。 wordcloud库把词云当作一个WordCloud对象 wordcloud.WordCloud( )代表一个文本对应的词云 可以根据文本中词语出现的频率等参数绘制词云 绘制词云的形状,尺寸和颜色可以设定 w = wordcloud.WordCloud() w.generate(txt) ...原创 2020-03-26 00:11:18 · 759 阅读 · 0 评论 -
Python数据分析之pandas库的使用详解
本篇文章目录一、前言二、什么是pandas三、pandas安装四、pandas的常用数据类型4.1 series:表示一维,带标签数组,一行或一列4.1.1创建series4.1.2 打印索引值4.1.3 打印数据值4.1.3 创建一个具有标签索引的series4.1.4 使用python字典创建series4.1.5 根据索引值查询数据4.2 DataFrame:表示二维,多行多列五、数据的读取......原创 2020-09-17 21:11:47 · 2310 阅读 · 0 评论 -
Python数据分析之Numpy库的使用详细讲解
简介 Numpy是科学计算基础库,提高大量科学计算的功能,比如数据统计,随机数生成等,其提供最核心类型为多维数组类型(ndarray),支持大量的维度数组与矩阵运算,Numpy支持向量处理ndarry对象,提高程序的运算速度。 安装 pip install numpy ...原创 2020-04-11 22:10:51 · 2614 阅读 · 0 评论 -
Python数据分析matplotlib库的使用
Python数据分析matplotlib库的使用原创 2020-04-09 23:43:41 · 3042 阅读 · 4 评论