- 博客(8)
- 收藏
- 关注
原创 Python复习
Python语言基础 标识符命名规则: 必须以字母或下划线开头,对英文字母的大小写敏感,不能有空格以及标点符号,不能使用关键字 Python3字符默认为16位Unicode编码 使用内置函数ord()可以把字符转换为对应的Unicode码,chr()可以把十进制数转换为对应的字符 complex(real,[imag])创建一个复数 多变量指向同一块内存地址 is运算符判断两个变量是否指向同一对象 不可变对象:int,str,complex 可变对象:列表 eval():将字符串当成有效
2021-12-08 22:13:44
724
原创 Python基础实验操作(一)
实验一 Python 基本操作 主要实验内容 print 、input 语句、pip 安装第三方库以及标准库的使用 1. print 语句 按照以下三张图片编程实现(实现以下任一个) print(''' @@@@@@@@@@@ @@@@ @@@@ @@@ @ @@@ @@ @@@ @@ @@@ @ @@@ @@@@ @@@@ @@@@@@@@@@@ ''' ) print(''' ++++++++++++ + + +++++++++++++ ''') print(''' 学Python,来
2021-11-27 22:39:38
9834
原创 爬虫-代理理论
#代理理论 #破解封IP这种反爬机制 #作用: #突破自身IP访问的限制 #隐藏自身真实IP #代理IP类型:http(应用http协议对应的URL中) #https(应用https协议对应的URL中) #代理IP的匿名度: #透明:服务器知道该次请求使用了代理,也知道请求对应的真实IP #匿名:知道使用了代理,不知道真实的IP #高匿:不知道使用了代理,也不知道真实IP import requests url='https://www.baidu.com/s?word=ip&tn=site88
2021-11-12 22:36:01
889
原创 xpath解析
xpath解析原理: 1.需要实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中 2.通过调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获 如何实例化一个etree的对象:from lxml import etree 1.将本地的HTML文档中的源码数据加载到etree对象中: etree.parse(filePath) 例:tree=etree.parse('text1.html',etree.HTMLParser()) 2.可以将从互
2021-11-07 20:21:26
733
原创 bs4解析
bs4数据解析原理: 实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中 通过调用BeautifulSoup对象中的相关属性或者方法进行标签定位和数据提取 如何实例化BeautifulSoup对象: from bs4 import BeautifulSoup 对象实例化: 将本地HTML文档中的数据加载到该对象中 将互联网上获取的页面源码加载到该对象中 提供的用于数据解析的方法和属性: ...
2021-10-24 13:03:00
262
原创 2021-10-13爬虫requests总结
#requests模块 #网络请求的两个模块:urllib模块;requests模块(模拟浏览器发请求) #如何使用:指定URL;发起请求;获取响应数据;持久化存储 #requests模块 url=' ' response=requests.get(url=url) page_text(或其他名称)=response.text) with open('./sogou.html','w',encoding='utf-8')as fp: fp.write(page_text) #需求...
2021-10-16 21:17:38
349
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人