Smiling之菜鸟日常-优快云博客

原创 Python复习

Python语言基础标识符命名规则：必须以字母或下划线开头，对英文字母的大小写敏感，不能有空格以及标点符号，不能使用关键字 Python3字符默认为16位Unicode编码使用内置函数ord()可以把字符转换为对应的Unicode码，chr()可以把十进制数转换为对应的字符 complex(real,[imag])创建一个复数多变量指向同一块内存地址 is运算符判断两个变量是否指向同一对象不可变对象：int,str,complex 可变对象：列表 eval():将字符串当成有效

2021-12-08 22:13:44 724

原创 Python基础实验操作（一）

实验一 Python 基本操作主要实验内容 print 、input 语句、pip 安装第三方库以及标准库的使用 1. print 语句按照以下三张图片编程实现（实现以下任一个） print(''' @@@@@@@@@@@ @@@@ @@@@ @@@ @ @@@ @@ @@@ @@ @@@ @ @@@ @@@@ @@@@ @@@@@@@@@@@ ''' ) print(''' ++++++++++++ + + +++++++++++++ ''') print(''' 学Python,来

2021-11-27 22:39:38 9834

原创爬虫-代理理论

#代理理论 #破解封IP这种反爬机制 #作用： #突破自身IP访问的限制 #隐藏自身真实IP #代理IP类型：http（应用http协议对应的URL中） #https（应用https协议对应的URL中） #代理IP的匿名度： #透明：服务器知道该次请求使用了代理，也知道请求对应的真实IP #匿名：知道使用了代理，不知道真实的IP #高匿：不知道使用了代理，也不知道真实IP import requests url='https://www.baidu.com/s?word=ip&tn=site88

2021-11-12 22:36:01 889

原创验证码识别

反爬机制：验证码；识别验证码图片中的数据，用于模拟登录操作识别验证码的操作： --人工肉眼识别（不推荐） --第三方自动识别

2021-11-09 22:06:57 144

原创 xpath解析

xpath解析原理： 1.需要实例化一个etree的对象，且需要将被解析的页面源码数据加载到该对象中 2.通过调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获如何实例化一个etree的对象：from lxml import etree 1.将本地的HTML文档中的源码数据加载到etree对象中： etree.parse(filePath) 例：tree=etree.parse('text1.html',etree.HTMLParser()) 2.可以将从互

2021-11-07 20:21:26 733

原创 bs4解析

bs4数据解析原理：实例化一个BeautifulSoup对象，并且将页面源码数据加载到该对象中通过调用BeautifulSoup对象中的相关属性或者方法进行标签定位和数据提取如何实例化BeautifulSoup对象： from bs4 import BeautifulSoup 对象实例化：将本地HTML文档中的数据加载到该对象中将互联网上获取的页面源码加载到该对象中提供的用于数据解析的方法和属性： ...

2021-10-24 13:03:00 262

原创数据解析和图片数据爬取（正则表达式）

数据解析分类：正则; bs4; xpath(***)

2021-10-22 11:16:35 290

原创 2021-10-13爬虫requests总结

#requests模块 #网络请求的两个模块：urllib模块；requests模块（模拟浏览器发请求） #如何使用：指定URL；发起请求；获取响应数据；持久化存储 #requests模块 url=' ' response=requests.get(url=url) page_text(或其他名称）=response.text) with open('./sogou.html','w',encoding='utf-8')as fp: fp.write(page_text) #需求...

2021-10-16 21:17:38 349

weixin_51594673的博客