python
latioas
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
豆瓣租房爬虫
初试爬虫,学习python也有一段时间了,想自己做个小项目实战锻炼一下,并在实战中总结。之前在豆瓣小组找房子,由于标题信息很乱,而且要经常翻页,十分不方便,所以想做个豆瓣小组关键信息提取的程序方便以后找房子。所以第一步自然是先爬取信息啦。爬取一个网页需要几步,拢共分三步:第一步,import 一些需要的库第二步,复制爬取的连接第三步,稍微补充一下细节,完成!fro...原创 2018-09-30 15:36:14 · 2172 阅读 · 0 评论 -
大家在谈租房时都在谈些什么?--豆瓣租房小组词云图
上次已经从豆瓣小组上爬取到了很多租房信息,但是标题大家都没有统一的规范,所以想通过统计词频来看看有什么关键字,看能不能利用统计出来的关键字对标题信息进行筛选提取。在找词频统计的时候看到了,居然有一个词云图的东西。这么好玩的东西当然不能错过啦。赶紧试试看先。这次生成词云图真的是拢共分三步。第一步:读取文本信息第二步:用分词工具进行分词第三步:用词云图库输出词云图from...原创 2018-09-30 16:17:48 · 1042 阅读 · 1 评论
分享