
爬虫
Shawn.Hu
1
展开
-
PHP爬虫:百万级别知乎用户数据爬取与分析
http://www.techweb.com.cn/network/system/2016-01-22/2266210.shtml 这次抓取了110万的用户数据,数据分析结果如下: 开发前的准备 安装Linux系统(Ubuntu14.04),在VMWare虚拟机下安装一个Ubuntu; 安装PHP5.6或以上版本; 安装MySQL5.5或以上版本; 安装curl、pcntl扩展转载 2016-01-30 15:08:12 · 1561 阅读 · 0 评论 -
Python抓取网页链接
http://blog.youkuaiyun.com/cscmaker/article/details/8730153 (1)因项目需要,需要从web中抓取相关的网页。正好想学习一下Python,首先看了一下Python简明教程,内容讲的不多,但是能够使你快速入门,我一直认为实例驱动学习是最有效的办法。所以直接通过实际操作怎么去抓取网页来丰富对Python的学习效果会更好。 Pyth转载 2016-01-31 13:52:50 · 1544 阅读 · 0 评论 -
python 抓去指定网页以及该网页上所有链接
http://www.oschina.net/code/snippet_77946_650 自己写的,原来是用来从往下上下载文档的,分享一下吧! 使用方法: python file_name_of_this_app.py http://www.oschina.net/ 标签: 代码片段(1)[全屏查看所有代码] 1. [代码]python代码 ?转载 2016-01-31 13:53:54 · 3109 阅读 · 0 评论 -
知乎:你是如何开始能写python爬虫?
http://www.zhihu.com/question/21358581转载 2016-01-31 13:56:32 · 1089 阅读 · 0 评论