数据分析学习
文章平均质量分 79
阮少年、
一个牛皮的少年
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
使用python爬虫对京东文胸销量简单分析
为何会有这么一个想法呢?很久之前,在微信公众号中看到过一片文章,关于分析文胸cup和颜色的文章。许久过去了,大概都忘记了。前几天又正好找点时间学一下python的爬虫,于是乎就想找一个小项目练练手,就想到了爬取京东文胸售卖记录,来分析cup和color。 本次大行动使用简单的python爬虫爬取的。共爬取了150个商品,每个商品爬最近的19页评论(超过19页后面的评论页面返回空数据),每页评论10条,总共爬取了148 x 19 x10条评论(实际24643条)。 150个商品 每个商品19页评论 每页评论原创 2021-02-08 15:59:32 · 701 阅读 · 1 评论 -
使用python爬虫对京东文胸销量简单分析
由于现在已经很晚了,已经晚上23.16了就简单介绍一下本次大行动。 本次大行动使用简单的python爬虫爬取的。共爬取了150个商品,每个商品爬最近的19页评论(超过19页后面的页面上找不到了),每页评论10条,总共爬取了148 x 19 x10条评论(实际24000多条)。 爬取链接: https://search.jd.com/Search?keyword=文胸&psort=4&wq=文胸&psort=4&click=1 用到工具: 爬取了如下字段: ‘评论’, ‘时间原创 2021-02-06 23:33:01 · 598 阅读 · 0 评论 -
数据分析笔记1
利用python做数据分析,要掌握几个包,先做一名调包侠。 numpy:NumPy是用Python进行科学计算的基础软件包. re:python正则表达式匹配包. jieba:“结巴”中文分词:做最好的 Python 中文分词组件 . nltk:python环境下NLP工具包,包含了丰富的文本处理和文本挖掘API. sklearn: Scikit learn 也简称 sklea...原创 2020-02-27 13:09:29 · 218 阅读 · 0 评论
分享