
pandas
文章平均质量分 93
餐霞散人
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Matplotlib-利用pandas进行数据分析并作可视化展示
一、简单的绘图展示 二、绘制柱状图 三、共用坐标轴绘制两种不同类型的图 四、pandas导入excel数据并绘制频率分布直方图 五、绘制箱线图 一、简单的绘图展示 randomList = np.random.randn(10).cumsum() randomList #结果 ''' array([ 0.43692622, -0.17404988, 0.847985...原创 2018-07-31 22:12:05 · 4762 阅读 · 0 评论 -
Pandas - 数据的聚合与分组计算
1 数据分组 - groupby() 1.1 按照多列进行分组的两种方法 1.2 对分组进行迭代 1.3 将列数据按照数据类型进行分组 1.4 通过字典或者Series对DataFrame数据进行分组 2 数据聚合 2.1 分组结果的内置聚合函数 2.2 自定义聚合函数 2.3 apply函数 自定义函数利用apply应用到分组对象上 2.4 分组加权平均数和相关系数 ...原创 2018-08-08 17:07:56 · 11749 阅读 · 0 评论 -
Pandas - 数据的加载、存储与解析
Pandas加载数据 Pandas存储数据 Pandas加载数据 import pandas as pd from pandas import DataFrame,Series import sys read_csv 从文件,URl,文件型对象中加载带分隔符的数据,默认分隔符为逗号(,) read_table 从文件,URl,文件型对象中加载带分隔符的数据,默认分隔符为...原创 2018-08-08 16:00:23 · 1710 阅读 · 0 评论 -
Pandas-基本数据结构-Series & DataFrame
1. Series 1.1 Series的创建 1.2 Series的索引切片 2. DataFrame 2.1 DataFrame的创建 2.2 DataFrame的索引,切片 3 Series中的数据运算 import pandas as pd from pandas import Series,DataFrame import numpy as np ...原创 2018-08-07 22:26:15 · 846 阅读 · 1 评论 -
Pandas - 数据规整化
1 数据规整化-合并数据集 1.1 merge的内连,外连,左连,右连 merge方法总结 1.2 Series的数据连接 1.2.1 concat() 1.2.2 合并重叠数据 combine_first & append 2 数据规整化-重塑与轴向选择 2.1 层次化索引 2.2 重塑层次化索引 3 数据规整化-数据转换 3.1 清除重复数据 3.1.1 dupli...原创 2018-08-07 20:54:29 · 733 阅读 · 0 评论 -
Pandas-进阶应用
1 pandas中的数据运算与算术对齐 2 iloc与loc的切片与索引 3 DataFrame与Series之间的运算 4 函数应用和映射 4.1 用apply将一个规则应用到DataFrame的行或者列上 4.2 applymap 将一个规则应用到DataFrame中的每一个元素 5 Series和DataFrame的排序 6 处理Series的重复索引 7 汇总计算描述统计 8...原创 2018-08-07 09:36:33 · 824 阅读 · 1 评论 -
时间模块-Python & Pandas
Python中的时间模块 1 time模块 1.1 时间戳 1.2 结构化时间 time.struct_time 1.2 格式化字符串 1.3 时间函数 1.4 总结:三种格式时间转化图 2 datetime模块 2.1时间日期对象转字符串 2.2 将字符串转datetime类型 Pandas中得时间日期转化 1 将时间日期类型作为Series得index索引 dateutil包里...原创 2018-08-06 20:50:51 · 627 阅读 · 0 评论 -
合作项目 : 人工智能专业相关职位数据分析 (爬虫+数据处理)
1 项目背景 2 Scrapy 爬取51job具体信息 3 数据清洗 3.1 导入csv 3.2 处理tags,提取其中有效信息 3.2.1 处理tags中数据数目不一致,规整数据信息 3.2.2 处理地区信息,提取其中省名 3.3 将处理好的tags信息与原数据合并并删除原tags列 3.4 处理薪资单位不一致问题,规整为 “/月” 3.5 将处理完的数据保存至csv ...原创 2018-08-16 18:39:24 · 1724 阅读 · 0 评论