
小确幸
文章平均质量分 81
囚生CY
不如养生
展开
-
【趣题分享】赤壁之战每日演兵(原诸葛亮列传兵法题)求解算法
小摸两下(补充了思路解析与可视化)原创 2024-12-05 23:28:38 · 583 阅读 · 0 评论 -
【烂活】斯坦福句法解析库使用小结+最新四月新番下载(以辉夜与阿尼亚为例)
整个烂活原创 2022-06-16 00:36:10 · 19917 阅读 · 1 评论 -
【趣题分享】如何数学推导三国杀王荣吉占摸牌的期望值?(Web Premiere)
全网首发的非模拟仿真方法!做点有趣的问题也是极好的!原创 2021-12-09 00:16:11 · 11753 阅读 · 2 评论 -
【原创百篇纪念】2048蒙特卡洛法与强化学习测试+B站视频爬取与Cookie攻击测试
回归原创 2021-09-14 00:12:50 · 27524 阅读 · 1 评论 -
【日常】轻松一刻:趣题分享(随机过程)
轻松一刻,解君烦忧原创 2021-03-23 22:09:07 · 10412 阅读 · 8 评论 -
【日常】轻松一刻:python传参还能这么写
闲来没事,分享一个工作上遇到的糗事。先把问题抛出来,假设现在需要定义一个函数myFunction(f,lst),其中参数f是一个函数,lst是一个列表,要求myFunction的运行结果是参数为的函数f依次接受lst中每一项为参数的运行结果,即myFunction(f,lst) = f(lst[0],lst[1], ... ,lst[n]),假设lst中有n+1个元素。其实这个问题很容易,只是如果没有接触过这个知识点就很难想到该怎么写。因为lst的长度是未知的,并不能用显式表达出f(lst[0],l原创 2020-07-31 16:24:42 · 10443 阅读 · 3 评论 -
【日常】python脚本系列:拳皇13一键出招以及连段实现
20200726更新原创 2020-07-14 01:12:50 · 16852 阅读 · 10 评论 -
【日常】CCB网上银行“云宠物”喂食自动化脚本
目录序言问题缘起问题分析与解决ccb_hyperparameters.pyccb_utils.pyccb_kdxfocr.py结语(附链接)序言鸽了挺久,差不多有三周没有写博客了。本来计划七月开始学个立身保命的Linux,结果天天在Azure上跟spark斗智斗勇,零零散散地遇到很多坑也都设法解决了,没想特别为了spark再水几篇博客,就都简单记录在每日的POST博客里凑数了。在这么说起来MARS也挺抠门的,给自己的员工一人分配了一个96G + 12核的spark集.原创 2020-07-11 01:04:02 · 13853 阅读 · 25 评论 -
【日常】从批量合并 PDF 到 PyPDF2 的使用
序言临近卷铺走人因此有不少手续要办,提交文件遇到需要合并PDF文件的需求。恰好个人电脑还处于文件强制加密的状态,编辑文档保存会自动加密,出于某些原因不方便恢复到正常状态的备份,因此给合并PDF带来很多麻烦。这时候会考虑是否有捷径可以走,这时候笔者发现Python是有可以进行PDF文件编辑操作的开源包PyPDF2,简单pip安装即可????pip install pypdf2下面提供了一个非常便捷的用于批量合并PDF文件的函数,只需要传入需要合并的PDF文件所在目录,以及合并后的文件导出路径原创 2020-06-17 00:15:45 · 11117 阅读 · 1 评论 -
【日常】PySpark踩坑记
序言—— 有的事情不去尝试,就永远无法探知自我能力的极限将能触碰到何处。—— 有的事情不去尝试,也永远无法知悉“糟粕污秽”究竟能恶心到什么境地。—— 显然PySpark不能是前者【Facepalm】自从劲松加入了小米项目的团队后,MARS数据这个烂摊子就全落在笔者一个打杂的身上,幸好有提前做好和PySpark相关的功课,不至于接手的时候慌得手忙脚乱,上手两三天后越发地被PySpark这种生成任何数据表的结果只要一行代码就能写出来的简洁、优雅所吸引,感叹SQL确实是一门精妙的语言,实在是极大地原创 2020-06-12 01:38:21 · 12564 阅读 · 3 评论 -
【Daily】Interested Bug in NetEase Online
Maybe English is the only open language in the world, where some blogs related to sensitive topics cannot be easily released in public using Chinese characters. Actually I just would like to share som...原创 2020-01-20 20:35:16 · 11055 阅读 · 1 评论 -
【附件】页面源代码
本博客是https://blog.youkuaiyun.com/CY19980216/article/details/104028709的附件,具体使用方法如下:新建一个txt文本文档; 将以下代码复制进去并保存; 修改该txt文件的后缀为".html"; 用浏览器打开该.html文件即可看到内容;原谅我出此下策<!DOCTYPE html><html lang="zh-...原创 2020-01-18 20:56:31 · 26252 阅读 · 1 评论 -
【日常】NaN
文章原标题:【日常】论如何在91flac上优雅地白嫖原文章没有过审,我觉得网站存在漏洞,就算我找不到,也有别人能找到,发现问题最终也是为了解决问题,如果只是一味的掩盖问题,不过是自欺欺人,千里之堤,溃于蚁穴罢了。既然如此,我就把原文章图片和代码放在这里,每张图片和代码都有标题,文字部分挂在GitHub上,大家想看的自取好了原文章文字链接或者可以移步https://blog.csdn...原创 2020-01-18 11:50:29 · 11830 阅读 · 1 评论 -
【日常】python站长素材网免费模板下载(以PPT模板为例)
近期疲于论文和别人给我挖的坑,可能很长一段时间不会更新博客了。之前在寻找模板时发现了挺好的网站http://sc.chinaz.com/,上面有PPT,CSS,Bootstrap等许多种类的模板,并且有很多是可以免费获取。虽然免费的模板质量并不是很高,但是架不住数量多,仔细挑挑还是可以找到合适的模板的。一个个下载自然是很麻烦的了,当然是选择搞个小爬虫,挂一个晚上就完事咯。以PPT模板下...原创 2019-12-13 19:32:26 · 12616 阅读 · 1 评论 -
【日常】Geetest滑动验证码(三代canvas版)处理小结(以B站登录验证为例)
问题描述这个问题确实让我困扰了太长时间,今天花了半天时间,并没有找到非常完满的解决方案,只是在解决问题的过程中学会了一些其他知识,我最后还是要通过人工来判断大致的移动距离,然后根据误差做微调。大致做个总结了,并且认为网站如果真心愿意反爬虫,完全可以处理到让爬虫无懈可击。今年四月份时B站的Geetest验证码大致情况可以通过https://blog.youkuaiyun.com/CY19980216/a...原创 2019-12-01 21:28:51 · 12683 阅读 · 1 评论 -
【日常】如何处理“火星文”乱码
问题描述爬虫中常常会遇到两种乱码,一种是https://blog.youkuaiyun.com/CY19980216/article/details/103116623中遇到的乱码,严格来说这不是乱码,这是字符编码后的结果,而且它根本不乱,只是我们看不懂而已,但是计算机是可以轻易读懂它是什么意思的。第二种便是如下图所示的情况了????¡¾ÉϺ£ÕÐƸ£¬ÇóÖ°¡¿-Ç°³ÌÎÞÓÇ▽奻漆桸...原创 2019-11-22 20:29:34 · 15884 阅读 · 1 评论 -
【日常】利用代理IP伪装进行多进程爬虫
最近有些饱暖思淫欲了,对之前爬虫的速度很不满意了。主要是在爬虫速度上的需求问题,如果追求速度就很容易被网站封锁IP;如果追求稳定地爬取只能通过两次访问之间间隔一个随机时间来避免网站对爬虫的封锁,然而这样爬虫就很没有效率,拿爬取雪球网组合调仓记录https://blog.youkuaiyun.com/CY19980216/article/details/82770410为例,每个组合的调仓记录最多可以有50页,...原创 2018-11-20 10:24:43 · 11747 阅读 · 1 评论 -
【日常】利用python保持WLAN持续连接(实时监测,即断即连)
被校园网恶心了好一阵子了,每天晚上睡觉前把把爬虫运行放那儿,早上起床就发现网已经断了,爬虫自然也报销。维持网络状态保持稳定的连接状态对于大多数普通人都是有极大意义的,于是我打算用知识创造一些柴火,权当日常消遣。程序简短不多做解释,思想即每隔alternate时间访问一次百度,如果成功访问则表示网络连接正常,否则大概率是网络断了,这时候再每隔timeout时间去重新联网,直到能够连接成功为止↓↓...原创 2018-11-11 10:56:10 · 12742 阅读 · 1 评论 -
【补档】
最近刚刚进村写博客,精心创作却苦于无人阅览。于是耍了点小聪明准备写个小爬虫给自己的博客刷刷访问量。以下代码是对《【项目记录】雪球网股票组合数据爬虫(包括雪球模拟登录代码)》这篇博客(博客链接:https://blog.youkuaiyun.com/CY19980216/article/details/82770410)进行的不断访问以提高访问量,由于代码非常浅显易懂,我就不多加赘述,大家觉得有用就拿去用。...原创 2020-08-20 00:51:10 · 13342 阅读 · 13 评论