
爬虫
tianyunzqs
【纯干货分享,个人学习笔记】欢迎关注个人公众号:NLPer笔记簿
展开
-
python爬虫(一)爬取糗事百科
最近需要收集语料,因此学习了一些爬虫的知识,参考网上对糗事百科的爬虫,编写了如下代码#!usr/bin/env python# -*- coding: utf-8 -*-import refrom urllib import requestfor page in range(1, 2): print(page) url = 'http://www.qiushibai原创 2017-08-12 23:46:33 · 357 阅读 · 0 评论 -
python爬虫(二)爬取知乎问答
都说知乎上问答的质量挺高,刚学爬虫没几天,现在对其问答内容进行爬虫实验。在知乎首页,通过输入关键词,搜索问题,之后点击问题找到该问题对应的网友回答。根据该过程,爬虫过程需要分为两步:1、通过关键词(Java)搜索问题,得到url=https://www.zhihu.com/search?type=content&q=java,根据该url爬取该页面下所有的问题及其对应的问题id;2原创 2017-08-13 00:23:04 · 1537 阅读 · 0 评论