Python
C爬爬
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
小白学Python(一)
小白学Python(一) 一、 注释 #–单行注释 ‘’’ ‘’’ 多行注释 注:在Python2中为了支持中文必须写中文注释在第一行#coding=utf-8 二、 定义变量 语法:变量名=变量值 例:a=10 在第一次为变量赋值为定义变量,第一次之后就为修改变量 变量的类型: 1、 数字 int(整型) long(长整型) float(浮点型) complex(复数) 2、 布尔类型...原创 2018-12-04 20:41:25 · 519 阅读 · 1 评论 -
使用XPath的爬虫
爬取某贴吧 import requests from lxml import etree import json class Tieba(object): def __init__(self,tieba_name): self.tieba_name=tieba_name self.headers={ "User-Agent": "Mo...原创 2018-12-18 19:25:44 · 337 阅读 · 0 评论 -
Python3爬虫之urllib
urllib库的基本使用 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 在Python中有很多库可以用来抓取网页,我们先学习urllib。 Urllib是python内置的HTTP请求库 包括以下模块 urllib.request 请求模块 urllib.error 异常处理模块 urllib.parse url解析模块 urllib.robotparser ro...原创 2018-12-11 19:04:47 · 229 阅读 · 0 评论 -
python3爬虫之爬虫的原理
爬虫的基本流程 发起请求 通过HTTP库向目标站点发起请求,也就是发送一个Request,请求可以包含额外的header等信息,等待服务器响应 获取响应内容 如果服务器能正常响应,会得到一个Response,Response的内容便是所要获取的页面内容,类型可能是HTML,Json字符串,二进制数据(图片或者视频)等类型 解析内容 得到的内容可能是HTML,可以用正则表达式,页面解析库进行解析,可...原创 2018-12-11 18:33:31 · 158 阅读 · 0 评论 -
Python 爬虫实战
学习再多的理论不实际动手,还是不会写,今天抽点空,写了两个常见的例子 一、爬取百度贴吧的图片 import requests from lxml import etree import json class Tieba(): def __init__(self,name): self.name = name self.header = {"User-Age...原创 2018-12-27 20:04:00 · 367 阅读 · 0 评论 -
python3爬虫之 PyQuery库
简介 PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的,都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择,PyQuery 是 Python 仿照 jQuery 的严格实现。语法与 jQuery 几乎完全相同,所以不用再去费心去记一些奇怪的方法了。 初始化 初始化的时候一般有三种传入方式:传入字符串,传入url,传入文件 字符串初始化 html = ''' ...原创 2018-12-17 14:25:20 · 283 阅读 · 0 评论 -
动态HTML处理————selenium库的使用
Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器)。 Selenium 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。 Selenium 自己不...原创 2018-12-20 10:47:22 · 561 阅读 · 0 评论 -
Python等学习工具推荐
今天给大家推荐一个学习的工具: http://www.runoob.com/ 个人觉得这个里面的原创 2018-12-06 20:25:36 · 194 阅读 · 0 评论 -
python3爬虫之BeautifulSoup
BeautifulSoup的使用 from bs4 import BeautifulSoup html = ''' <html><head><title>The Dormouse's story</title></head&原创 2018-12-13 19:45:40 · 194 阅读 · 0 评论 -
Python3爬虫之Requests
Requests 的使用 import requests response = requests.get("https://www.baidu.com") print(type(response)) print(response.status_code) print(type(response.text)) print(response.text) print(response.cookies...原创 2018-12-12 18:33:34 · 259 阅读 · 0 评论 -
小白学Python(八)--------函数(2)
一、局部变量 <1>什么是局部变量 如下图所示: <2>小总结 局部变量,就是在函数内部定义的变量 其作用范围是这个函数内部,即只能在这个函数中使用,在函数的外部是不能使用的。因为其作用范围只是在自己的函数内部,所以不同的函数可以定义相同名字的局部变量(打个比方,把你、我是当做成函数,把局部变量理解为每个人手里的手机,你可有个iPhone8,我当然也可以有原创 2018-12-05 17:32:14 · 236 阅读 · 0 评论 -
小白学Python(七)-------函数(1)
一、函数定义和调用 <1>定义函数 定义函数的格式如下: def 函数名(): 代码 demo: #定义一个函数,能够完成打印信息的功能 def printInfo(): print(’------------------------------------’) print(’ 人生苦短,我用Python’) print(’-------------------------------...原创 2018-12-05 16:26:12 · 293 阅读 · 0 评论 -
小白学Python(六)--------元组、字典
一、元组 Python的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号,列表使用方括号。 aTuple = (‘et’,77,99.9) aTuple (‘et’,77,99.9) <1>访问元组 <2>修改元组 说明: python中不允许修改元组的数据,包括不能删除其中的元素。 <3>count, index index和...原创 2018-12-05 16:14:03 · 295 阅读 · 0 评论 -
小白学Python(五)---------列表
列表介绍 一、列表 <1>列表的格式 变量A的类型为列表 namesList = [‘xiaoWang’,‘xiaoZhang’,‘xiaoHua’] 比C语言的数组强大的地方在于列表中的元素可以是不同类型的 testList = [1, ‘a’] <2>打印列表 demo: namesList = [‘xiaoWang’,‘xiaoZhang’,‘xiao原创 2018-12-05 15:42:29 · 221 阅读 · 0 评论 -
小白学Python(四)----字符串
一、 字符串 <1>python中字符串的格式 如下定义的变量a,存储的是数字类型的值 a = 100 如下定义的变量b,存储的是字符串类型的值 b = “hello xiaobai.cn” 或者 b = ‘hello xiaobai.cn’ 小总结: <2>双引号或者单引号中的数据,就是字符串 字符串输出 Demo: name = ‘xiaobai原创 2018-12-05 15:13:55 · 260 阅读 · 0 评论 -
小白学Python(三)------循环
一、while循环 <1> while循环的格式 while 条件: 条件满足时,做的事情1 条件满足时,做的事情2 条件满足时,做的事情3 … demo: i = 0 while i < 5: print(“当前是第%d次执行循环” % (i + 1)) print(“i=%d” % i) i+=1 结果: 当前是第1次执行循环 i=0 当前是第2次执行循环 i=1 当原创 2018-12-05 14:43:43 · 353 阅读 · 0 评论 -
小白学Python(二)----判断语句
一、判断语句 1、if判断语句 <1> if判断语句介绍 if语句是用来进行判断的,其使用格式如下: if 要判断的条件: 条件成立时,要做的事情 demo1:(demo的中文意思:演示、案例) age = 30 print("------if判断开始------") if age >= 18: print(“我已经成年了”) print("原创 2018-12-05 14:34:00 · 223 阅读 · 0 评论
分享