
python
文章平均质量分 86
ys1030
这个作者很懒,什么都没留下…
展开
-
破解一个滑块验证码需要多少行代码?两千?一千?两百行就够了
做网络爬虫的同学肯定见过各种各样的验证码,比较高级的有滑动、点选等样式,看起来好像挺复杂的,但实际上它们的核心原理还是还是很清晰的,本文章大致说明下这些验证码的原理以及带大家实现一个滑动验证码我之前做过 Web 相关开发,尝试对接过 Lavavel 的极验验证,当时还开发了一个 Lavavel 包:https://github.com/Germey/LaravelGeetest,在开发包...原创 2019-09-21 19:47:47 · 1477 阅读 · 0 评论 -
一键分析你的上网行为, 看看你平时上网都在干嘛?
Chrome浏览器历史记录文件可视化注:本文来自:[github地址](github.com/shengqiangz…原文和源代码请移步上方github地址查看和下载~。简介想看看你最近一年都在干嘛?看看你平时上网是在摸鱼还是认真工作?想写年度汇报总结,但是苦于没有数据?现在,它来了。这是一个能让你了解自己的浏览历史的Chrome浏览历史记录分析程序,他适用于Chrome浏览器...转载 2019-09-23 19:23:14 · 163 阅读 · 0 评论 -
python web 部署:nginx + gunicorn + supervisor + flask 部署笔记
python web 部署web开发中,各种语言争奇斗艳,web的部署方面,却没有太多的方式。简单而已,大概都是 nginx 做前端代理,中间 webservice 调用程序脚本。大概方式:nginx + webservice + scriptnginx 不用多说,一个高性能的web服务器。通常用来在前端做反向代理服务器。所谓正向与反向(reverse),只是英文说法翻译。代理服务,简而言...原创 2019-09-24 10:11:19 · 174 阅读 · 0 评论 -
腾讯视频爬虫
其实事情是这样的,上个礼拜我去面试一家公司,工作是做爬虫。然后有了以下对话。面试官:你是自学的,我有一些问题问你,python的浅拷贝和深拷贝是什么?我:呵呵面试官:额。。。你能不能说一说你是怎么理解python的面向对象编程?我:呵呵面试官:额。。。。好吧,我不问你基础了。你有没有爬过动态的网页?我:有啊,我爬过豆瓣啊。面试官:那我让你爬视频网站你怎么爬?F12里查看器是看不到视频...原创 2019-09-24 10:16:00 · 2513 阅读 · 1 评论 -
新闻类网页正文通用抽取器
项目起源开发这个项目,源自于我在知网发现了一篇关于自动化抽取新闻类网站正文的算法论文——《基于文本及符号密度的网页正文提取方法》这篇论文中描述的算法看起来简洁清晰,并且符合逻辑。但由于论文中只讲了算法原理,并没有具体的语言实现,所以我使用 Python 根据论文实现了这个抽取器。并分别使用今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻做了测试,发现提取效...转载 2019-09-26 09:28:07 · 210 阅读 · 0 评论 -
用Python制作好玩的小游戏
炎炎夏日,独坐家中,闲来无事,便用Python写了2个简单的解闷小游戏,分享给你们,也希望大家通过这两个小游戏可以学习Python的编程知识。1.用Python破解九宫格九宫格最早叫「洛书」,现在也叫「幻方」。九宫格游戏对人们的思维锻炼有着极大的作用,千百年来对人们的思维训练影响巨大,从古时起人们便意识到九宫格的教育意义,现在也经常出现在文学、影视中。好了,放了这么多洋屁,该...原创 2019-09-26 11:37:18 · 877 阅读 · 0 评论 -
python高准确率滑动验证破解平台,提供免费api接口,解决反爬虫
滑动验证是网站反爬虫、反作弊的升级,滑动验证也是机器学习在反爬虫、反作弊领域的应用;此前停止了每日一更的专题分享,进入了不定期的项目分享,本项目就是分享的第一个。本项目也是一个简单的全栈项目,使用tornado做的后端、Bootstrap4做的前端;核心的识别问题在此前讲过,因此不做原理上的介绍。为了对大家有帮助,因此该项目已经部署上线并提供了直接返回json数据...原创 2019-09-26 11:42:11 · 245 阅读 · 0 评论 -
【Python】正则表达式基础知识
正则表达式(regular expression)是一种处理字符串的工具,功能十分强大。正则表达式使用预定义的特定模式去匹配一类具有共同特征的字符串,主要用于字符串处理,可以快速,准确地完成复杂的查找,替换等处理要求。正则表达式的主要内容如下。Python标准库的re模块提供了正则表达式操作所需要的功能,可以直接使用re。re.search(pattern,string...原创 2019-09-27 10:02:24 · 421 阅读 · 0 评论 -
程序员必须掌握的算法集合
程序员必须要掌握的十大经典算法算法一:快速排序算法快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来。快速排序使用分治法(Divide...原创 2019-10-07 09:56:47 · 339 阅读 · 0 评论