
数据科学
文章平均质量分 73
餐霞散人
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Matplotlib-绘图入门
1 创建一个简单的绘图1.1 导入matplotlib1.2 创建画板1.3 进行绘图2 绘制折线图3 绘制柱状图/条形图4 绘制直方图5 绘制饼图6 绘制散点图7 绘制堆叠图1 创建一个简单的绘图1.1 导入matplotlibimport matplotlib.pyplot as plt1.2 创建画板#创建画板p...原创 2018-07-30 21:06:11 · 262 阅读 · 0 评论 -
Pandas - 数据的聚合与分组计算
1 数据分组 - groupby()1.1 按照多列进行分组的两种方法1.2 对分组进行迭代1.3 将列数据按照数据类型进行分组1.4 通过字典或者Series对DataFrame数据进行分组2 数据聚合2.1 分组结果的内置聚合函数2.2 自定义聚合函数2.3 apply函数自定义函数利用apply应用到分组对象上2.4 分组加权平均数和相关系数...原创 2018-08-08 17:07:56 · 11749 阅读 · 0 评论 -
Pandas-基本数据结构-Series & DataFrame
1. Series1.1 Series的创建1.2 Series的索引切片2. DataFrame2.1 DataFrame的创建2.2 DataFrame的索引,切片3 Series中的数据运算import pandas as pdfrom pandas import Series,DataFrameimport numpy as np...原创 2018-08-07 22:26:15 · 846 阅读 · 1 评论 -
Pandas - 数据规整化
1 数据规整化-合并数据集1.1 merge的内连,外连,左连,右连merge方法总结1.2 Series的数据连接1.2.1 concat()1.2.2 合并重叠数据 combine_first & append2 数据规整化-重塑与轴向选择2.1 层次化索引2.2 重塑层次化索引3 数据规整化-数据转换3.1 清除重复数据3.1.1 dupli...原创 2018-08-07 20:54:29 · 733 阅读 · 0 评论 -
Scipy---入门篇
一、scipy中io模块使用二、scipy中的stats子模块,用于产生符合特定规律的随机数二、计算随机数的均值和标准差三、scipy计算随机数组的偏度、峰度三、计算数据符合正太分布程度的函数五、练习一、scipy中io模块使用import scipyimport numpy as npimport matplotlib.pyplot as pltfrom...原创 2018-08-01 20:57:27 · 6508 阅读 · 0 评论 -
自然语言分析数据预处理---获取国外电影评论中出现多的热词
import pandas as pd#读取labeledTrainData.tsv文件df = pd.read_csv("./labeledTrainData.tsv", sep='\t', escapechar='\\')df.head(10) .dataframe thead tr:only-child th { ...原创 2018-08-01 14:41:34 · 1270 阅读 · 0 评论 -
Matplotlib-高级篇
*导入常用库的一个方法一、高级篇之再论柱状图二、Matplotlib加载数据并进行可视化展示—with open:三、Matplotlib加载数据并进行可视化展示-简化版(numpy.loadtxt())四、加载网络数据并用码头plotlib进行可视化展示*导入常用库的一个方法在当前工程目录下新建一个base.py文件,输入常用需要导入的语句等#base...原创 2018-07-30 21:51:55 · 2834 阅读 · 0 评论 -
Matplotlib-综合演练
绘制正余弦图像绘制正余弦图像1. 快速创建三角函数2. 绘制函数图像并修改线宽及颜色3. 调整坐标轴4. 特殊点注释完成图1. 快速创建三角函数import matplotlib.pyplot as pltimport numpy as npfrom numpy import pi #导入numpy中的pi常量#用来正常显示中文标签 plt.rcPa...原创 2018-07-30 21:24:47 · 440 阅读 · 0 评论 -
合作项目 : 人工智能专业相关职位数据分析 (爬虫+数据处理)
1 项目背景2 Scrapy 爬取51job具体信息3 数据清洗3.1 导入csv3.2 处理tags,提取其中有效信息3.2.1 处理tags中数据数目不一致,规整数据信息3.2.2 处理地区信息,提取其中省名3.3 将处理好的tags信息与原数据合并并删除原tags列3.4 处理薪资单位不一致问题,规整为 “/月”3.5 将处理完的数据保存至csv...原创 2018-08-16 18:39:24 · 1724 阅读 · 0 评论