
python3爬虫
文章平均质量分 51
Happy画板
痴迷数学
展开
-
跟爬虫干上了^O^
# !/usr/bin/env python# -*- coding:utf-8 -*-import requestsimport refrom bs4 import BeautifulSoup for x in range(0,637,7): x=str(x) url = 'http://jingyan.baidu.com/user/npublic?uid=d1b612b原创 2017-11-19 13:39:41 · 389 阅读 · 0 评论 -
用python爬取我的百度经验目录
获得每一篇文章的链接:import reimport urllib.requestdef getHtml(url): page = urllib.request.urlopen(url) html = page.read() return htmldef getImg(html): reg = r'<a href="([.*\S]*\.html)" title='原创 2017-11-15 15:10:09 · 457 阅读 · 0 评论 -
用python爬取自己的百度经验目录,并保存为word文档
# -*- coding: utf-8 -*-# !/usr/bin/env pythonimport requestsimport refrom docx import Documentfrom docx.shared import Ptfrom docx.oxml.ns import qnt = Document()p = t.add_paragraph(u'百度经验目录:\...原创 2018-03-01 13:25:04 · 1329 阅读 · 0 评论 -
python教程
python 如何去除字符串中的双引号https://jingyan.baidu.com/article/b0b63dbf37b6294a483070cc.html用python对彩色图像进行直方图均衡化处理https://jingyan.baidu.com/article/aa6a2c148f83d50d4c19c4cb.htmlpython调用matplotlib处理图片的基本方法https:...原创 2018-05-07 15:45:12 · 1613 阅读 · 0 评论 -
百度经验正文爬虫
# -*- coding: utf-8 -*- # !/usr/bin/env python import requestsimport reimport time,randomu0 = 'http://jingyan.baidu.com/user/npublic?uid=d1b612bceb0dc22ba8ffe137&pn=' for x in range(0,50,...原创 2018-05-14 20:56:49 · 331 阅读 · 0 评论