第一章 学习Scipy 及一个小例子

Scipy与Numpy数据处理
本文介绍如何利用Scipy和Numpy进行数据处理,包括数据读取、预处理及清洗,并展示了散点图的绘制过程。重点讲解了Scipy中常用工具如stats、interpolate等的功能。

为方便,Numpy的所有命名空间都可以通过Scipy访问

import numpy, scipy
print scipy.version.full_version
print scipy.dot is numpy.dot

#0.13.0b1
#True

比较常用的scipy工具有stats(统计学工具包)、scipy.interpolate(插值,线性的,三次方的)、cluster(聚类)、signal(信号处理)

数据读取,使用scipy下的genformtxt(),读取到数据有(743,2)743行2列

# encoding=utf-8
import scipy as sp
data = sp.genfromtxt('web_traffic.tsv', delimiter='\t')

# 定义使用\t作为分隔符
print data[:10]
print data.shape

预处理和清洗数据

将各维度分成两个向量

# 清理无效数据
x = x[~sp.isnan(y)]
y = y[~sp.isnan(y)]

# 散点坐标图
plt.scatter(x, y)
# x坐标
plt.xlabel('Time')
plt.ylabel('Hits/hour')
# tick 标记号于
plt.xticks([w*7*24 for w in range(10)],
           ['week %i'%w for w in range(10)])
# 自动测量/规模 tight=紧
plt.autoscale(tight=True)
# 开启网格
plt.grid()
# 显示图表
plt.show()

 

 

转载于:https://www.cnblogs.com/evoler/p/5405722.html

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值