- 博客(6)
- 收藏
- 关注
原创 去哪儿网分析
import numpy as np import pandas as pd df=pd.read_csv('C:/Users/xiaoli/data/1.csv') df.head(2) df.info() df[df.价格<1000] df[(df.价格<1200)&(df.出发地=='成都')] df[df.价格.between(1000,2000)].sort_values(by='价格',ascending=True) df.groupby('出发地')['路线名.
2022-01-06 14:54:58
706
原创 双十一美妆
import numpy as np import pandas as pd df=pd.read_csv('D:/data/双十一淘宝美妆数据.csv') df df.info()#查看数值类型,日期类型 df['update_time'].unique()#以数组形式返回唯一值 df.columns df.describe() df.isnull().sum() df.fillna(0,inplace=True)#空值填充 df.duplicated().sum() df=df.dro.
2022-01-06 14:15:57
659
原创 二手房数据处理
import pandas as pd import numpy as np df=pd.read_table('D:/data/lianjiahouselist.txt',sep=';') df.columns=['编号','省','市','区县','位置','详细地址','单价','总价','户型','楼层','面积','户型结构','套内面积','建筑类型','朝向','建筑结构','装修类型','梯户比','有无电梯','上传时间','房屋类型','住宅类型','抵押情况'] df.reindex.
2022-01-05 20:40:58
185
原创 TianMao订单数据分析
import pandas as pd df = pd.read_csv('D:/data/tmall_order_report.csv') df.head(50) df.columns df.describe() df.info() df.isnull().sum()#缺失值的查看,订单付款时间为空说明没有付款 df.duplicated().sum()#重复值查看 df.columns df.columns = df.columns.str.strip()#去列名的空值 df.colum.
2022-01-05 20:30:15
220
原创 去哪儿网预处理和分析
import numpy as np import pandas as pd df=pd.read_csv('C:/Users/xiaoli/data/qunar_freetrip.csv',encoding='gbk',sep='\t') df.head() df.describe() df.info() df.columns data=df.rename(columns=lambda x: x.strip()) data.head(2) data.columns data1=data[.
2022-01-05 20:22:49
393
原创 美妆数据分析
import pandas as pd product=pd.read_excel('D:/日化.xlsx',sheet_name=1) order = pd.read_excel('D:/日化.xlsx',sheet_name=0) order.head(5) product.head(5) product.info() order.info() order['订单日期'].unique() product.isnull().sum() order.isnull().sum() orde.
2022-01-05 15:55:03
777
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅