
数据分析
文章平均质量分 54
feiyy404
选择往往比努力更重要。
展开
-
matplotlib数据可视化分析(1)-- numpy读取文件以及 ndarray 的基本操作
matplotlib z支持函数式绘图和面向对象式绘图。函数式绘图,参考了 matlib 里面的绘图函数语法,简单容易上手。面向对象式绘图,更懂 matplotlib 底层架构,有更多的功能。matplotlib 使用控制台绘图In [2]: import matplotlib.pyplot as plt In [3]: plt.plot([1,2,3],[3,2,1])Out...原创 2018-09-21 11:09:27 · 2711 阅读 · 0 评论 -
pandas 中的时区相关
pytz 库时间序列处理中比较烦的是对时区的处理,尤其是夏令时(DST)转变。许多人都选择以协调世界时(UTC) 来处理时间序列在python中 时区信息来自于 pytz 库。 import datetime import pandas as pd import numpy as np import pytz r1 = pytz.common_timezones[-5:]...原创 2019-06-01 16:32:27 · 700 阅读 · 0 评论 -
pd 中时间的范围频率以及移动
将时间序列转换为一个具有固定的频率的时间序列只需要调用resample即可:import datetimeimport pandas as pdimport numpy as npdates = [ datetime.datetime(2011, 1, 2), datetime.datetime(2011, 1, 5), datetime.datetime(20...原创 2019-06-01 14:42:25 · 1224 阅读 · 0 评论 -
python中常见的日期处理方式以及对应的 pd 形式以及工具
日期和时间数据类型以及工具在python 中,我们只要会用到 datetime time 以及 calendar 模块datetime 以毫秒形式存储日期和时间datetime.timedelta 表示两个时间对象之间的时间差import datetimedelta = datetime.datetime(2011, 1, 7) - datetime.datetime(2008, 6,...原创 2019-05-30 23:41:47 · 2009 阅读 · 0 评论 -
使用 pandas 中的方法生成季度点数据
生成 start 和 end 之间的全部季度点列表def gen_all_quarters(start: datetime.datetime, end: datetime.datetime): """ 生成 start 和 end 之间全部季度时间点列表 :param start: :param end: :return: """ idx ...原创 2019-05-30 12:24:46 · 2442 阅读 · 0 评论 -
pandas 时间序列处理
转换为时间对象 import datetime import pandas as pd date = '20170808' pd.to_datetime(date) date = ['2017-6-26', '2017-6-27'] # ok # date = ["20170101", "20180101"] # ok # import datetime...原创 2019-05-24 15:02:05 · 430 阅读 · 0 评论 -
pandas中set_index与reset_index
import pandas as pd# 创建示例data = { "a": ["bar", "bar", "foo", "foo"], "b": ["one", "two", "one", "two"], "c": ["z", "原创 2018-12-21 18:47:01 · 435 阅读 · 0 评论 -
pandas 中 ix loc iloc 的使用
"""pandas 中 ixlociloc"""import pandas as pd# loc 是根据行标签索引数据# loc[1]表示的是索引的是第一行(index 是整数)data = [[1, 2, 3], [4, 5, 6]]index = [0, 1]columns = ["a", "b", "c"]df = pd.DataFrame(d原创 2018-12-21 18:45:53 · 1671 阅读 · 0 评论 -
matplotlib数据可视化分析(7)-- matplotlib 直方图的绘制
什么是直方图由一系列高度不等的纵向条形组成,表示数据分布的情况例如某年级同学的身高分布情况注意和条形图的区别举例子:# coding:utf-8import matplotlib.pyplot as pltimport numpy as npmu = 100 # 分布的均值sigma = 20 # 分布的标准差x = mu + sigma*np.random.randn(...原创 2018-09-21 17:58:31 · 507 阅读 · 0 评论 -
matplotlib数据可视化分析(6)-- matplotlib 条形图的绘制
什么是条形图以长方形的长度为变量的统计图表用来比较多个项目分类的数据大小通常用于比较较小的数据集分析例如不同季度的销量,不同国家的人口等基本用法# coding:utf-8import matplotlib.pyplot as pltimport numpy as npN = 5y = [20, 10, 30, 25, 15]index = np.arange(N)p...原创 2018-09-21 17:01:53 · 473 阅读 · 0 评论 -
matplotlib数据可视化分析(4)-- matplotlib 折线图的绘制
什么是折线图折线图是用直线段将各个数据连接起来组成的图形;常用来观察数据随时间变化的趋势;例如股票价格、温度变化等等。举例:# coding:utf-8import matplotlib.pyplot as pltimport numpy as npx = np.linspace(-10, 10, 100)y = x**2plt.plot(x, y)plt.show()...原创 2018-09-21 16:04:27 · 675 阅读 · 0 评论 -
matplotlib数据可视化分析(3)-- matplotlib 散点图的绘制
什么是散点图散点图显示两组数据的值,每个点的坐标位置由变量的值决定。由一组不连续的点完成,用于观察两种变量的相关性。例如身高-体重、温度-维度等等。举例我们来实现身高和体重的散点图:# coding:utf-8import matplotlib.pyplot as pltheight = [161, 170, 182, 175, 173, 165]weight = [50, 58,...原创 2018-09-21 15:19:22 · 1239 阅读 · 0 评论 -
matplotlib数据可视化分析(2)-- numpy将数组存储到文件
参考: https://blog.youkuaiyun.com/u010089444/article/details/527384791 数组以二进制的格式保存np.save 和 np.load 是读写磁盘数据的两个主要函数。默认情况下,数组以未压缩的原始二进制格式保存在扩展名为 npy 的文件中,以数组 a 为例:# coding:utf-8import numpy as npc = np.ra...转载 2018-09-21 14:20:45 · 1027 阅读 · 0 评论 -
numpy.void 结构体对应位置的运算问题思路
原创 2019-08-28 10:46:43 · 1830 阅读 · 0 评论