
python
Atticus_Johnson
保持乐观,点滴进步
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
爬虫学习笔记(三)
安装selenium 在下载前先要确定自己的chrome的版本号,在浏览器的帮助->关于chrome可以看到。 安装chromedriver 登录 https://sites.google.com/a/chromium.org/chromedriver/downloads 可能国内用户无法登陆 下载安装 然后将.exe文件放到chrome的安装文件中,chrome安装路径我的是:C:\...原创 2019-05-15 21:06:29 · 257 阅读 · 0 评论 -
爬虫学习笔记(一)
1 get & post (1) GET请求将提交的数据放置在HTTP请求协议头中 import requests url = 'http://www.baidu.com' response = requests.get(url) print(response.text) 输出: <!DOCTYPE html> <!--STATUS OK--><html&g...原创 2019-05-11 23:25:57 · 1120 阅读 · 0 评论 -
爬虫学习笔记(二)
学习beautifulsoup 介绍 Beautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间. Beautiful Soup 官方文档(中文): https://beautifulsoup.readthedocs.io/zh_CN/...原创 2019-05-13 00:02:31 · 489 阅读 · 0 评论 -
爬虫学习笔记(四)
任务: 模拟登录丁香园,并抓取论坛页面所有的人员基本信息与回复帖子内容。 一 首先利用selenium登录网站 1.切换到账号密码表单登录,我采用了利用style将display值变为block,代码如下: from selenium import webdriver import time browser = webdriver.Chrome() # 此处请选择您的浏览器 js1 = ...原创 2019-05-17 19:53:00 · 331 阅读 · 0 评论