
Python
文章平均质量分 70
bodyHealthy
最怕一生碌碌无为,最后又说平凡可贵
展开
-
python爬虫实战——小红薯
任务:在 win 环境下,利用 Python、webdriver、JavaScript等,获取 xiaohongshu 某个博主的全部作品。本文仅做学习和交流使用。1、博主页面分析section 代表每一项作品,但即使博主作品有很多,在未登录状态下,只会显示 20 项左右。向下滚动页面,section 发生改变(个数不变),标签中的 index 会递增。向下滚动页面时,到一定的范围时,会发送一个获取作品数据的请求,该请求每次只请求 30 项作品数据。原创 2024-03-13 21:45:15 · 7351 阅读 · 10 评论 -
python爬虫实战——DouYin
以登录状态(或者有cookies本地存储等状态)访问目标博主页面,滚动到作品最底部,然后在控制台中执行JavaScript脚本,获取全部作品的信息(在这里是作品链接以及作品类型),然后写出到文本文件中。上述的操作是在无登录状态下进行的,即使在webdriver中操作让页面滚动,也只能获取到有限的作品,大约是 20 项左右。然后在python中读入该文件,使用json解析,转成字典列表的形式,遍历列表,对每一个字典(就是每一个作品)进行处理即可。进入作品页前 判断作品是视频作品还是图文作品。原创 2024-03-12 23:25:14 · 20683 阅读 · 10 评论 -
python 学习笔记(6)—— Flask 、MySql
这个包是一个 Python 的加密库,它提供了许多加密算法的实现,包括 'sha256_password' 和 'caching_sha2_password' 这两种 MySQL 的密码加密方式。该返回值可以是一个字符串,也可以是一个元组(包含状态码、响应体等的信息)等的形式。该错误指出需要 'cryptography' 包来处理 'sha256_password' 或 'caching_sha2_password' 的认证方式。:正在被触发的CSP指令 和 违反的CSP指令。:被CSP阻止的资源URI。原创 2023-09-13 00:07:53 · 954 阅读 · 0 评论 -
python 学习笔记(5)——SMTP 使用QQ邮箱发送邮件
如果是其他的邮箱,图片有可能可以显示(如企业微信的邮箱),html 的样式也可能会丢失不奏效。POP3/IMAP/SMTP/Exchange/CardDAV/CalDAV服务。将 receiver 写成每个人的邮箱账号数组即可。以下都 以 QQ邮箱 为发送方举例;使用 QQ邮箱发送邮件,需要到 “原创 2023-09-11 23:14:40 · 27131 阅读 · 3 评论 -
python 学习笔记(4)—— webdriver 自动化操作浏览器(基础操作)
使用 driver 前,需要下载浏览器对应的 driver。如要在 Chrome 浏览器上操作,就要下载Chrome Driver。下载并安装完成后,将.exe文件拷贝到 python.exe 同级的目录下。点击搜索后,会新创建一个标签页,此时需要更新 driver 到新的标签页面。这里使用Chrome浏览器,下载Chrome Driver。此时浏览器会打开一个新的标签页,我们需要。点击后,同样会新开一个标签页,此时我们把。在当前界面的右上角,有搜索功能,尝试。在界面执行一个脚本,滚动到页面底部。原创 2023-09-05 23:06:02 · 5810 阅读 · 1 评论 -
python 笔记(3)——request、爬虫、socket、多线程
利用 requests.session() 获取到 session 对象,使用 session 对象发送请求,可以维护cookies 和 session,不必自己操作。1、find、findAll 根据标签、属性等进行查找(find 是查找第一个匹配的;解析器可以使用:html.parser、lxml、xml、html5lib。查找页面元素的通用方法:find、findAll、select。1、使用requests发送http请求。3-2-2)使用css选择器来进行查找。1-2)发送 post 请求。原创 2023-09-01 13:01:47 · 1713 阅读 · 0 评论 -
python 笔记(2)——文件、异常、面向对象、装饰器、json
单引号会转换成双引号。在一个函数中定义了一个内部函数,并且该内部函数使用了外部函数的参数或变量,则称为闭包。装饰器本身也是一个函数,装饰器给其他的函数使用,可以改变程序执行的顺序。装饰器的内部函数接收到的参数就是传递给test的参数,第四行时,执行了 test 函数。明天是星期三,听说还是要下大雨,我觉得我不会开心;明天是星期三,听说还是要下大雨,我觉得我不会开心;昨天是星期一,天气晴朗,我很开心;今天是星期二,下了大雨,我很难过;昨天是星期一,天气晴朗,我很开心;今天是星期二,下了大雨,我很难过;原创 2023-08-31 13:25:23 · 959 阅读 · 0 评论 -
python 笔记(1)——基础和常用部分
可以看成是包含若干个python模块的文件夹(目录),但是该目录下需要有一个 __init__.py 文件才能被识别为一个包(可以在需要的时候在目录下直接创建一个__init__.py 文件);在导入一个模块的时候,实际上是把该模块的代码重新执行了一遍;元组是不可改变的,因此元组没有列表中的append、pop、remove等的方法。是包含python定义和语句的文件,每一个以.py后缀结尾的文件都可以看成是一个模块;:统计x在列表中出现的次数;:x再列表中第一次出现的位置。7-4)列表与元组之间的转化。原创 2023-08-30 22:06:21 · 422 阅读 · 0 评论