- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 【kaggle项目】Airbnb(爱彼迎)使用用户情况分析
数据来源: kaggle比赛项目【Airbnb New User Bookings】https://www.kaggle.com/c/airbnb-recruiting-new-user-bookings/data主要分析内容:1. 用户的画像分析- 用户性别分布特征- 用户年龄段的分布特征- 用户地区的分布特征2. 用户使用渠道的分析- 用户使用设备类型分析-以下为在jupy...
2019-10-09 01:57:40
4585
原创 对某电商交易数据的分析(数据经后期加工处理,不造成任何隐私泄露问题)
数据来源:某电商真实交易数据,经过后期处理,不会造成任何隐私的泄露。分析分为两步进行:数据清洗:主要是基于numpy和pandas库来进行重复值的处理和空值的处理,以及一些异常值的清洗。数据分析:该部分以不同的维度来进行分析,包括以产品、城市为维度并以销量和GMV指标进行分析;以价格为维度,并使用cut来进行分桶处理;通过对不同渠道下的订单量和GMV进行排序和分析;以及下单的时间分布情况...
2019-10-08 17:14:27
678
2
原创 爬取拉勾网“全国”“数据分析”、“深圳市”“数据分析”岗位招聘信息并进行分析
数据爬取:先编写了Python程序对“拉勾网”进行“数据分析”岗的招聘信息并存储为csv格式。其中使用到Request Headers伪装成浏览器来访问网页,由于网站的反爬措施,仅使用请求头的信息仍然会弹出错误提示,因此需要使用*Request.Seeion()*生成cookies小饼干来维持会话。连接成功之后则是使用到json来解析网页信息,并通过循环的方式爬取出我们需要的信息。详细的代码见下...
2019-10-07 02:01:12
431
爬取拉勾网“全国”“数据分析”、“深圳市”“数据分析”岗位招聘信息并进行分析.ipynb
2019-10-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人