- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 和爬虫战斗的日子02
如何防止利用接码平台恶意注册今天终于解决了利用接码平台注册大量账号进行数据爬取的问题,事情是这样的…周五晚上,照旧在系统管理后台又发现了一些爬虫账号在那爬取数据,拉黑这些账号后我打开了几个接码平台的网站,浏览过程中,我发现这些手机号基本上全是165开头的手机号,于是,我打开了百度,搜索“165开头的手机号”,如下图有两个关键词立刻吸引住了我“虚拟运营商”“虚拟号段”,那么什么是虚拟运营商呢?我们都知道,传统三大电信运营商是移动、联通、电信,虚拟运营商就是指依靠租用传统电信运营商的通信资源开展电信业
2020-05-24 15:30:40
236
原创 浅谈登陆模块
编程这项工作我认为可以简单,也可以很复杂,关键看我把他当作什么来看待。如果我把它仅仅当作是八小时内的一个工作,那就非常简单,许多代码都是重复的,都是可以从自己之前的项目里粘贴过来的,稍微改改就能应付,但我如果把它当作自己创作的一个作品,当作一件艺术品去精雕细琢,去想法设法升级它,让它性能更好,体验更优,细节更完善,那编程就是一件很复杂的事情。如果说大学毕业那会我更看重会做和做的快,那么现在的我关注的,则是做的好。追求完美,永无止境。
2020-05-17 16:23:26
3291
原创 和爬虫战斗的日子01
公司网站是一个内容类网站,招引了许多爬虫来爬取数据,有的爬虫比较温和,会克制自己,发送请求的频率比较低,这样的只要不影响网站性能我一般是睁一只眼闭一只眼的,但是有的爬虫就比较不要脸了,发送请求的频率已经超过了其他用户的总和,占用带宽和服务器资源,导致系统变慢,我一直在和这种厚颜无耻之人作斗争…啊,是的,我就骂你了,谁让你爬我数据这两天发现了大量恶意注册账号,借助网上众多的接码平台(这些平台也是臭不要脸,央视都曝光过也还是没能打击到他们),实现短信注册,然后靠大量的账号在我网站上爬取数据,今天一天我就拉黑了
2020-05-11 20:22:22
217
原创 我在优快云的第一篇博客
我在优快云的第一篇博客。成为一名软件工程师已经快四年了,以前也冒出来过写技术博客的想法,但是总会给自己找一些接口,比如太忙没时间、怕自己写的东西被人评论等等,所以每次都无疾而终。我知道写博客有很多好处,最大的好处应该就是有利于自己技术的积累和提高,现在的我,对自己有太多不满,我想改变,想成为一个发光发亮的人所以这次我踏出了第一步我决定每周写4篇,就当做日记吧我也不知道我能坚持多久试试看吧希望别打自己脸喽 (^_-)...
2020-05-11 19:23:00
189
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人