
数据分析
文章平均质量分 95
numpy,pandas,matplotlib,PIL,OpenCV等
郑德帅
滴滴
展开
-
基于Python的大数据分析基础(十)---词云(wordcloud)
9 词云工 具库结巴+wordcloud: pip3 install jieba pip3 install wordcloud9.1.jieba分词: 这里的分词主要是真多中文分词(Chinese Word Segmentation) 1.jieba 分词的主要用法: jieba.cut(s,cut_all=True) 参数: s...原创 2019-11-19 13:09:42 · 8804 阅读 · 0 评论 -
基于Python的大数据分析基础(九)--- 数据分析
8 数据分析 8.1 基本统计分析(描述性统计分析) 一般统计某个变量的最小值,第一个四分位值,中值,第三个四分位值,以及最大值 均值(Mean),中位数(Median)和众数(Mode) 其中均值和中位数用于定量的数据,众数用于定性的数据 对于定 量数据( Data )来说,均值是总和除以总量 N,中位数是数值大小位于中间(奇偶总量处理不同)...原创 2019-11-17 16:55:20 · 8123 阅读 · 0 评论 -
基于Python的大数据分析基础(八)---数据可视化之PIL图库和OpenCV图库
点击查看PILLOW官方文档 和 点击查看OpenCV官方文档本篇博客目录7.8 Python 图像处理基础 7.8.1 PIL图库 使用:pyhton3 中安装pillow即可使用PIL。及其具体使用 7.8.2 OpenCV图库 安装 pip3 install opencv-python,注意不是pip3 install opencv。...原创 2019-11-17 15:47:02 · 8466 阅读 · 0 评论 -
基于Python的大数据分析基础(三)--- Pandas 操作文件(csv,excel,txt,Mysql)
4.Pandas 读取并操作文件(csv,excel,txt,Mysql数据库) 4.1 CSV文件的读取# -*- coding: UTF-8 -*-'''@Author :Jasonpandas 操作 csv 文件'''import pandas as pdimport csvdef write_to_csv(): df = pd.DataFrame(...原创 2019-11-06 14:19:58 · 9527 阅读 · 0 评论 -
基于Python的大数据分析基础(四)---Pandas数据处理
5.Pandas数据处理 5.1 数据清洗 5.2 数据抽取 5.3 插入记录 5.4 修改记录 5.5 交换行和列 5.6 排名索引 5.7 数据合并5.1到5.7是在原来的pandas的基础上稍微深化了下,顺带复习。5.8之后将详细编写 5.8 数据计算 5.9 数据分组 5.10 数据处理# -*- ...原创 2019-11-06 20:20:45 · 8136 阅读 · 0 评论 -
基于Python的大数据分析基础(五)---Pandas数据处理案例
6.数据处理实例6.1.数据如图: 6.2.需求: 6.3.处理数据: 我个人拿到数据,直接想着转换成DataFrame,然后着手算总分,然后直接数据分组,还是太年轻了...self.df["total"] = self.df.英语 + self.df.体育 + self.df.军训 + self.df.数分 + self.df.高代 +se...原创 2019-11-07 20:25:01 · 9165 阅读 · 0 评论 -
基于Python的大数据分析基础(一)---- NumPy
1.NumPy简介及其使用NumPy是一个功能强大的Python库,主要用于对多维数组执行计算,允许更高级的数据操作和数学计算。 它包括数学、逻辑、数组形状变换、排序、选择、I/O 、离散傅立叶变换、基本线性代数、基本统计运算、随机模拟等等。 机器学习模型:在编写机器学习算法时,需要对矩阵进行各种数值计算。例如矩阵乘法、换位、加法等。NumPy提供了一个非常好的库,用于简单(在编写代码...原创 2019-11-01 14:17:53 · 7665 阅读 · 0 评论 -
基于Python的大数据分析基础(二)--- Pandas及其主要数据结构
1.Pandas简介Pandas是一个Python包,提供快速、灵活和富有表现力的数据结构,使关联或标记数据的使用既简单又直观。它旨在成为Python中进行实际,真实世界数据分析的基础高级构建块。此次外还有更广泛的目标,即称为任何语言中最强大,最灵活的开源数据分析/操作工具。适合许多不同类型的数据具有异构类型列的表格数据,如SQL表或Excel表 有序和无序的时间序列数据 具有...原创 2019-11-01 15:08:22 · 7602 阅读 · 0 评论 -
基于Python的大数据分析基础(七)---数据可视化之Seaborn,Pandas可视化功能,networkx网络图,folium绘制地图
点击查看Seaborn官方文档本篇博客目录 7.3 Seaborn 专门的统计数据可视化包 安装 pip3 install seaborn 7.3.1 直方图和密度函数 7.3.2 散点图和密度函数 7.3.3 分组散点图 7.3.4 六边形图 7.3.5 二维核密度估算图 7.3.6 矩阵散点图7.3.7 线性相关图 7....原创 2019-11-16 16:36:28 · 11388 阅读 · 1 评论 -
基于Python的大数据分析基础(六)---数据可视化之Matplotlib
点击查看Matplotlib官方文档7.Python对数据的可视化处理 7.1 工具 Jupyter Notebook %matplotlib inline #在 jupyter 中嵌入显示,图片内嵌,而不是弹出。缺陷:除非代码一次执行,不然无法叠加绘图 %config InlineBackend.f...原创 2019-11-16 15:34:47 · 8428 阅读 · 0 评论