- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 Windows平台下Python对文件路径的获取
01. 直接使用绝对地址代码实例:ABS_PATH = r'E:\ChenGang\PycharmProjects\oschina_spider\oschina\oschina\out\xunlei_items.json' # 文件的绝对路径print u"文件绝对路径:", ABS_PATHfile = open(ABS_PATH, 'r')print u'文件内容前10个字符:', fil
2016-06-06 07:43:49
3537
翻译 爬虫介绍02:爬取第一个站点
这篇文章讲了如果编写一个爬虫,以及编写爬虫过程总用到的外部工具和模块。通过文章,我们可以了解关于网站、User Agent、Sitemap、爬取延迟和其它的爬取策略等内容。
2016-05-23 13:18:54
5172
翻译 爬虫介绍01:目标站背景调查
爬取某个站点前,问我们最好提前做一个背景调查,例如:站点的Robot.txt文件、Sitemap文件、网站使用的技术、网站的归属信息等。这些信息既有助于帮助我们确定爬虫方案,也可以帮助我们规避很多陷阱~
2016-05-22 14:41:09
1010
翻译 欢迎使用优快云-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2016-05-22 12:43:14
298
QQVoice网络电话
2012-11-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅