
爬虫
StalloneYang
细节决定成败,态度决定一切!
http://blog.youkuaiyun.com/u011757108
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Task5 安装selenium并学习,登录163.邮箱
使用selenium模拟登陆163邮箱 废话不多少,全在代码注释中 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2019/3/5 9:00 # @Author : StalloneYang # @File : 05_selenium_163.py # @desc: from selenium import webd...原创 2019-03-05 09:40:29 · 2293 阅读 · 0 评论 -
爬虫 Task1 学习get与post请求
1.学习get与post请求,尝试使用requests或者是urllib用get方法向 百度一下,你就知道发出一个请求,并将其返回结果输出。 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2019/3/1 17:19 # @Author : StalloneYang # @File : day01.py # @de...原创 2019-03-01 17:48:21 · 1520 阅读 · 0 评论 -
Task2 正则表达式
1.什么是正则表达式并尝试一些正则表达式并进行匹配 以下是从别人的总结中copy过来的,学习和留着以后方便查用 一、校验数字的表达式 数字:^[0-9]*$ n位的数字:^\d{n}$ 至少n位的数字:^\d{n,}$ m-n位的数字:^\d{m,n}$ 零和非零开头的数字:^(0|[1-9][0-9]*)$ 非零开头的最多带两位小数的数字:^([1-9][0-9]*)+(...原创 2019-03-02 21:39:53 · 562 阅读 · 0 评论 -
Task6 学习IP相关知识
Task6 学习IP相关知识 1.学习什么是IP ip地址:用来在网络中标记一台电脑的一串数字,比如192.168.1.1;在本地局域网上是惟一的。 每一个IP地址包括两部分:网络地址和主机地址。 PS:以上来源:https://baijiahao.baidu.com/s?id=1603349398532855649&wfr=spider&for=pc 2.为什么会出现IP被...原创 2019-03-06 14:42:43 · 637 阅读 · 0 评论 -
Task3 学习beautifulsoup
常用的几个beautifulsoup技巧 html对象 text文本去掉标签 print(soup) print(soup.text) <class ‘bs4.BeautifulSoup’> 对象类型 print(type(soup)) 查找a标签 .text打印a的内容 print(soup.find(‘a’)) print(soup.find(‘a’).text) ...原创 2019-03-03 19:25:51 · 308 阅读 · 0 评论 -
Task4 学习xpath
学习xpath,使用lxml+xpath提取内容。 使用xpath提取丁香园论坛的回复内容 #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2019/3/4 9:22 # @Author : StalloneYang # @File : 04_xpath_dingxiang.py # @desc:学习xpath,使用lx...原创 2019-03-04 17:45:23 · 324 阅读 · 0 评论