- 博客(6)
- 收藏
- 关注
原创 去哪儿网分析
import numpy as npimport pandas as pddf=pd.read_csv('C:/Users/xiaoli/data/1.csv')df.head(2)df.info()df[df.价格<1000]df[(df.价格<1200)&(df.出发地=='成都')]df[df.价格.between(1000,2000)].sort_values(by='价格',ascending=True)df.groupby('出发地')['路线名.
2022-01-06 14:54:58
682
原创 双十一美妆
import numpy as npimport pandas as pddf=pd.read_csv('D:/data/双十一淘宝美妆数据.csv')dfdf.info()#查看数值类型,日期类型df['update_time'].unique()#以数组形式返回唯一值df.columnsdf.describe()df.isnull().sum()df.fillna(0,inplace=True)#空值填充df.duplicated().sum()df=df.dro.
2022-01-06 14:15:57
616
原创 二手房数据处理
import pandas as pdimport numpy as npdf=pd.read_table('D:/data/lianjiahouselist.txt',sep=';')df.columns=['编号','省','市','区县','位置','详细地址','单价','总价','户型','楼层','面积','户型结构','套内面积','建筑类型','朝向','建筑结构','装修类型','梯户比','有无电梯','上传时间','房屋类型','住宅类型','抵押情况']df.reindex.
2022-01-05 20:40:58
164
原创 TianMao订单数据分析
import pandas as pddf = pd.read_csv('D:/data/tmall_order_report.csv')df.head(50)df.columnsdf.describe()df.info()df.isnull().sum()#缺失值的查看,订单付款时间为空说明没有付款df.duplicated().sum()#重复值查看df.columnsdf.columns = df.columns.str.strip()#去列名的空值df.colum.
2022-01-05 20:30:15
188
原创 去哪儿网预处理和分析
import numpy as npimport pandas as pddf=pd.read_csv('C:/Users/xiaoli/data/qunar_freetrip.csv',encoding='gbk',sep='\t')df.head()df.describe()df.info()df.columns data=df.rename(columns=lambda x: x.strip())data.head(2)data.columnsdata1=data[.
2022-01-05 20:22:49
351
原创 美妆数据分析
import pandas as pdproduct=pd.read_excel('D:/日化.xlsx',sheet_name=1)order = pd.read_excel('D:/日化.xlsx',sheet_name=0)order.head(5)product.head(5)product.info()order.info()order['订单日期'].unique()product.isnull().sum()order.isnull().sum()orde.
2022-01-05 15:55:03
720
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人