第二节课

#导入数据
import pymysql
import numpy as npy
import pandas as pda
import matplotlib.pylab as pyl

conn=pymysql.connect(host="127.0.0.1",user="root",passwd="root",db="csdn")
sql="select * from taob"
data=pda.read_sql(sql,conn)
#数据清洗
#发现缺失值
x=0
data["price"][(data["price"]==0)]=None
for i in data.columns:
    for j in range(len(data)):
        if(data[i].isnull())[j]:
            data[i][j]="64"
            x+=1
#print(x)            

#异常值处理
#找到异常值
#画散点图(横轴:价格,纵轴:评论数)
data2=data.T
price=data2.values[2]
comt=data2.values[3]
pyl.plot(price,comt,"o")
pyl.show()
#处理异常数据
#评论大于100000,价格大于1000都处理掉
line=len(data.values)
col=len(data.values[0])
da=data.values
'''改值处理法'''
'''
for i in range(0,line):
    for j in range(0,col):
        #评论
        if(j==3 and da[i][3]>65):
            #修改值处理法
            da[i][j]=35
        #价格
        elif(j==2 and da[i][2]>100):
            #修改值处理法
            da[i][j]=64
'''
'''删除处理法'''

x=0
for i in range(0,line):
    for j in range(0,col):
        #评论
        if(da[i][3]>65):
            #删除处理法
            continue
        #价格
        elif(da[i][2]>100):
            #删除处理法
            continue
        else:
            #删除处理法
            if(x==0):
                newda=da[i]
            else:
                newda=npy.row_stack((newda,da[i]))
            x+=1
#da2=da.T
da2=newda.T
price=da2[2]
comt=da2[3]
pyl.plot(price,comt,"o")
pyl.show()

#分布分析
'''
求最值
计算极差
组距:极差/组数
绘制直方图
'''
pricemax=da2[2].max()
pricemin=da2[2].min()
commentmax=da2[3].max()
commentmin=da2[3].min()
#极差
pricerg=pricemax-pricemin
commentrg=commentmax-commentmin
#组距
pricedst=pricerg/13
commentdst=commentrg/13
#绘制价格直方图
#npy.arrange(最小,最大,组距)
pricesty=npy.arange(pricemin,pricemax,pricedst)
pyl.hist(da2[2],pricesty)
pyl.show()

#绘制评论数直方图
commentsty=npy.arange(commentmin,commentmax,commentdst)
pyl.hist(da2[2],commentsty)
pyl.show()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值