
python
文章平均质量分 82
xiaoziHZP
这个作者很懒,什么都没留下…
展开
-
2020-09-10
1. 获取leetcode题目信息由于手机端访问leetcdoe使用起来不是很方便,没法快速查到leetcode的每日一题,所以想着写一个爬虫来爬取每日一题并以邮件的形式发送到个人的邮箱。下面记录了相应的历程。首先查看下需要爬取的内容,如下图,我们需要爬取方框中所选的内容,包括题名、内容、难易度等。首先考虑到这个每日一题肯定不是硬编码在网页内容内而是动态获取的,ok,chrome开发工具开始干活,选择network-->xhr, 刷新之后发现出现大量graphql。GraphQL 既是原创 2020-09-10 20:48:59 · 554 阅读 · 0 评论 -
python爬取有声小说网站实现自动下载实例
最近想下载一些有声小说,但是苦于没有找到批量下载,每次都是单集单集的下载的,觉得很麻烦,就考虑用python写一个爬虫来实现自动搜集小说,自动下载。下面就是开始展开漫漫的爬虫之路。基础的就不多说了,重点就是针对在项目中遇见的一些问题进行记录。主要就以下三个方面进行展开:1.正则表达式的使用2.编码格式3.如何获取js动态加载生成的内容1.正则表达式的使用正则表达式主要是用于匹配相应的标签,这个可以...原创 2018-03-15 15:20:01 · 8280 阅读 · 0 评论 -
python爬取动态网站实例——以爬取豆瓣电影分类排行榜为例
最近在编写python爬虫的时候,发现有时候爬取的网页和实际看到的效果不一致,经过各种搜索之后发现这时因为网页在加载的时候动态加载的结果,所以,为了可以获得相应的结果,需要模拟相应的请求。本文以豆瓣电影排行榜为例,初步实现一个可以自动抓取,获得各种影片相关信息的爬虫。首先,爬虫能够直接爬取的,一般是我们右键查看源所得到的相应源代码,异步加载的动态内容需要后续发送请求获得,那么如何查看相应的请求。在...原创 2018-03-09 11:26:58 · 4294 阅读 · 0 评论 -
趣学算法(2)——贪心算法
目录2.2 最优装载问题 算法设计: 算法实现:2.3 背包问题 算法设计:算法实现:2.4 会议安排 算法思想: 算法实现:2.5 最短路径 问题描述: 算法思想:算法实现:2.6 霍夫曼编码 问题描述: 算法思想:...原创 2019-03-08 20:28:25 · 840 阅读 · 1 评论 -
趣学算法(3)——递归分治
目录3.2 二分搜索技术 问题分析: 算法思想: 算法设计: 算法实现:3.3 合并排序 问题描述: 问题分析: 算法实现:3.4 快速排序 算法思想: 算法设计: 算法实现:3.5 大整数相乘 问题描述:...原创 2019-03-10 12:28:42 · 533 阅读 · 0 评论 -
趣学算法(4)——动态规划
目录4.3 最长的公共子序列问题描述:问题分析:算法实现:4.4 编辑距离问题分析:算法思想:算法实现:4.5 游船租赁问题描述:问题分析:算法实现:4.6 矩阵连乘问题描述:问题分析:算法思想:算法实现:动态规划是一种分治思想,但与分治算法不同的是,分治算法是把原问题分解为若干子问题,自顶向下求解各种子问题,合并子问题的解,...原创 2019-03-12 20:36:48 · 440 阅读 · 0 评论