
日常
文章平均质量分 86
囚生CY
不如养生
展开
-
【趣题分享】赤壁之战每日演兵(原诸葛亮列传兵法题)求解算法
小摸两下(补充了思路解析与可视化)原创 2024-12-05 23:28:38 · 583 阅读 · 0 评论 -
【日常】爬虫技巧进阶:textarea的value修改与提交问题(以智谱清言为例)
Everything's okay, and so are you, sxy原创 2023-11-17 23:22:07 · 1712 阅读 · 1 评论 -
【日常】矩阵正态分布参数检验问题
wk牛逼!!原创 2023-02-16 20:42:44 · 11044 阅读 · 1 评论 -
【坑】金山文档批量下载技巧记录(Python+JS)
有思必有得原创 2022-06-27 19:53:19 · 16847 阅读 · 6 评论 -
【烂活】斯坦福句法解析库使用小结+最新四月新番下载(以辉夜与阿尼亚为例)
整个烂活原创 2022-06-16 00:36:10 · 19917 阅读 · 1 评论 -
【日常】轻松一刻:是谁偷改了我的参数名称?
我又回来了!原创 2022-05-19 00:45:59 · 10542 阅读 · 1 评论 -
【趣题分享】如何数学推导三国杀王荣吉占摸牌的期望值?(Web Premiere)
全网首发的非模拟仿真方法!做点有趣的问题也是极好的!原创 2021-12-09 00:16:11 · 11753 阅读 · 2 评论 -
【日常】爬虫进阶技巧:selenium加载扩展插件(extension)与配置用户数据(user-data)
才学满溢,有恃无恐原创 2021-10-17 16:10:53 · 27719 阅读 · 3 评论 -
【日常】《中国统计年鉴》与《中国金融年鉴》数据表爬虫(附1985-2020所有Excel资源)
想要打个招呼真难原创 2021-06-07 21:05:14 · 17017 阅读 · 25 评论 -
【日常】轻松一刻:趣题分享(随机过程)
轻松一刻,解君烦忧原创 2021-03-23 22:09:07 · 10412 阅读 · 8 评论 -
【日常】爬虫学习进阶:百度翻译的秘密(2021版)
偶尔爬爬虫还是有点意思的,权当消遣。原创 2021-02-08 15:22:43 · 14566 阅读 · 3 评论 -
【日常】Transformer要点记录及实现demo(PyTorch与Tensorflow)
序言目录序言原创 2021-01-16 00:37:48 · 12646 阅读 · 3 评论 -
【待办】三国杀单挑测试脚本
序言前天晚上开始写之前一直想写的三国杀单挑仿真项目,初始灵感是想要测试四血界孙权单挑四血新王异在不同状态下的优劣(如新王异零装备起手,单+1马起手,+1马和藤甲/仁王盾起手,单雌雄剑起手,单木牛流马起手),后续是想使用强化学习方法进行训练得出界孙权的最优打法,之前听说过四血标孙权可以和四血新王异五五开,以为界孙权的容错会相对高一些,但是看了去年半个橙子上传的老炮杯一局经典的界孙权内奸单挑主公新王异的对局,看下来界孙权实在是太被动了(当然那时候新王异已经神装雌雄+木马了,普遍认为界孙权大劣,但是最后还是界孙原创 2021-01-10 16:58:14 · 12601 阅读 · 4 评论 -
【Share 2021】caoyang.log(OLD VERSION)
字数溢出,停更原创 2020-12-29 22:56:49 · 203507 阅读 · 4 评论 -
【优快云年度之“战”征文】机器学习该怎么学?
前排声明:本文为优快云年度之“战”征文稿,笔者文笔平平,仅以此文抛砖引玉,博君一笑。序言黄梅雨,旧时曲,来日何遇,默而不语。萍水逢处谈笑来,高腔如叹拂袖去。南柯一梦浮生尽,繁花落,新灯起。这是笔者作于今年6月26日毕业离校日的小词,三个室友与我逐一道别,行向不知名的远方,直到寝室里只剩下最后一人。适逢黄梅雨季,又遇瘟疫流行,甚至连毕业照都未曾留下一张的我,想不到落幕收场竟是如此凄凉,只得将无尽的遗憾化为对未来的期盼。其实书写一篇简洁凝练的年度总结对于笔者来说并非易事,笔者手写十年日记,一年时光原创 2020-12-26 23:06:05 · 10987 阅读 · 1 评论 -
【日常】dgl库搭建GNN进行节点分类与边分类任务示例
序言之前的笔记【学习笔记】图神经网络库 DGL 入门教程(backend pytorch) 写得比较详尽,但是教程中的代码写得比较零散,这里抽空把两个最常见的任务,节点分类和边分类的代码整合了一下,加了一些注释便于理解,已备后查。目录序言1 节点分类代码示例边分类代码示例1 节点分类代码示例节点分类利用了dgl的内置数据集CiteseerGraphDataset,下载速度很快,默认会下载到C:\Users\用户名\.dgl目录下,该数据集是一个图分类数据集,里面包含了许多张图,这里只取第一张图,原创 2020-12-12 20:42:53 · 13221 阅读 · 10 评论 -
【日常】multiprocessing使用与多进程爬虫队列通信示例
multiprocessing库笔记目录multiprocessing库笔记1 Process模块2 Pool模块3 Queue模块4 Pipe模块5 Lock模块6 Manager模块71 Process模块Process模块就是用于定义进程的;class multiprocessing.Process(group=None, target=None, name=None, args=(), kwargs={}, *, daemon=None):实例化对象: process = Pr原创 2020-12-07 16:11:28 · 10885 阅读 · 1 评论 -
【学习笔记】图神经网络库 DGL 入门教程(backend pytorch)
dgl库笔记DGL官方文档目录dgl库笔记1 DGL的安装2 DGL的后端3 一个有趣的入门示例3.1 从"Zachary's karate club" Problem讲起1 DGL的安装DGL官方文档 的安装方法似乎有点繁琐, 直接下载wheel文件安装即可;非CUDA版本的dgl库, 去清华镜像dgl仓库 下载对应版本的whl文件直接用pip install安装即可;CUDA版本的dgl库, 目前有五种不同的dgl库对应不同的CUDA版本:清华镜像dgl-cu90仓库 ;原创 2020-12-06 11:28:53 · 50386 阅读 · 75 评论 -
【日常】查看Python库的本地安装信息及pip库的使用方法(补tensorflow2.3.0所有依赖whl)
序言需求源于想要对每次执行pip install和conda install命令来安装Python库做个日志记录, 并且想要对Anaconda根目录下的生成文件情况做个记录;原因是最近发现很多Python库的更新太频繁, 前几天刚装的torchvision就出了0.8.0版本; 而且一个库还会有许多不同版本, 就dgl库(一个绘图库, 可以对知识图谱以及各种图神经网络进行可视化)而言, 目前除了一个非CUDA版本的dgl库, 其他的CUDA版本如dgl-cu100, dgl-cu101, dgl-cu1原创 2020-11-30 16:48:56 · 14629 阅读 · 1 评论 -
【日常】pytorch编写“自创”的MRR损失函数
序言最近又重新开始学习Pytorch,暑期抽时间目录序言1 PyTorch中的损失函数与优化器1.1 torch.nn中定义的损失函数1.2 torch.optim中定义的优化器1.3 损失函数与优化器在模型训练中的使用方法1.4 自定义损失函数的编写方法2 自定义的MRR损失函数2.1 MRR指标2.2 MRR损失函数定义2.3 MRR损失函数实现2.4.1 一种有趣的尝试2.4.2 全torch方法实现2.5 MRR损失函数测试后记1 PyTorch中的损失函数与优化器1.1 torch.n原创 2020-11-28 23:50:37 · 11187 阅读 · 4 评论 -
【日常】SpringBoot缓存注解器及整合redis实现(附近期一些python零碎的内容)
下里巴人,一些上不了大雅之堂的东西原创 2020-11-21 12:20:33 · 10515 阅读 · 1 评论 -
【1024两年祭】溯流光 觅杳杳
目录序言1 PyFlann库安装时报错:ImportError: No moduler named 'index'2 markdown公式编写中的易忘点Summary for a nobody序言写了整三年blog了,差不多70多篇,大部分都是原创,恰好前两年的1024节都写不出blog,拿不到优快云的1024勋章,今年当然也没有东西可写,但是想要拿个1024勋章聊以自慰,怎么办呢?那就水一篇blog好了呀~在笔者水文章之前,还是分享一些最近遇到的一些小tip,勉强充实一下文章内容,免得被人诟病[原创 2020-10-24 15:19:43 · 11196 阅读 · 1 评论 -
【论文阅读】查询搜索中的安全和效率权衡(ACM 10.1145)
论文标题:Privacy and Efficiency Tradeoffs for Multiword Top K Searchwith Linear Additive Rank Scoring具有线性累和排序评分的多单词TopK搜索的隐私性与效率性权衡目录摘要1. 引入与相关工作 INTRODUCTION AND RELATED WORK2. 问题定义与设计考虑 PROBLEM DEFINITION AND DESIGN CONSIDERATIONS3. 服务端部分排序 SERVER-SIDE PAR原创 2020-10-19 18:56:10 · 10821 阅读 · 1 评论 -
【日常】关于爬虫中iframe节点处理小结(以超星课件下载为例)
随便写点东西原创 2020-10-12 21:15:13 · 12763 阅读 · 3 评论 -
【学习笔记】市场机制设计
拍卖机制原创 2020-10-10 13:22:59 · 11203 阅读 · 1 评论 -
【日常】DES加密算法python实现_以密码编码学与网络安全——原理与实践(第六版)课后习题3.11为例
序言为了加深对DES加密算法的理解,lvchen很贴心地布置了一道手算DES加密结果的题,从昨晚回寝算到今天中午才写完,主要是花时间把代码逻辑实现了一遍,加深记忆也便于后续重复使用。笔者参考了经典的DES算法详解这篇博客的解析,博主翻译得通俗易懂,内容详实,应该算是能找到的DES讲解中说得最明白的一个版本了。本文主要是以密码编码学与网络安全——原理与实践_第6版的课后习题3.11为例,实现DES加密算法中的56位密钥选取算法:PC1置换48位子密钥生成算法:PC2置换28位半密钥的循环左移算法原创 2020-09-26 13:39:05 · 11614 阅读 · 1 评论 -
【日常】轻松一刻:python传参还能这么写
闲来没事,分享一个工作上遇到的糗事。先把问题抛出来,假设现在需要定义一个函数myFunction(f,lst),其中参数f是一个函数,lst是一个列表,要求myFunction的运行结果是参数为的函数f依次接受lst中每一项为参数的运行结果,即myFunction(f,lst) = f(lst[0],lst[1], ... ,lst[n]),假设lst中有n+1个元素。其实这个问题很容易,只是如果没有接触过这个知识点就很难想到该怎么写。因为lst的长度是未知的,并不能用显式表达出f(lst[0],l原创 2020-07-31 16:24:42 · 10443 阅读 · 3 评论 -
【日常】python脚本系列:拳皇13一键出招以及连段实现
20200726更新原创 2020-07-14 01:12:50 · 16853 阅读 · 10 评论 -
【日常】CCB网上银行“云宠物”喂食自动化脚本
目录序言问题缘起问题分析与解决ccb_hyperparameters.pyccb_utils.pyccb_kdxfocr.py结语(附链接)序言鸽了挺久,差不多有三周没有写博客了。本来计划七月开始学个立身保命的Linux,结果天天在Azure上跟spark斗智斗勇,零零散散地遇到很多坑也都设法解决了,没想特别为了spark再水几篇博客,就都简单记录在每日的POST博客里凑数了。在这么说起来MARS也挺抠门的,给自己的员工一人分配了一个96G + 12核的spark集.原创 2020-07-11 01:04:02 · 13853 阅读 · 25 评论 -
【日常】从批量合并 PDF 到 PyPDF2 的使用
序言临近卷铺走人因此有不少手续要办,提交文件遇到需要合并PDF文件的需求。恰好个人电脑还处于文件强制加密的状态,编辑文档保存会自动加密,出于某些原因不方便恢复到正常状态的备份,因此给合并PDF带来很多麻烦。这时候会考虑是否有捷径可以走,这时候笔者发现Python是有可以进行PDF文件编辑操作的开源包PyPDF2,简单pip安装即可????pip install pypdf2下面提供了一个非常便捷的用于批量合并PDF文件的函数,只需要传入需要合并的PDF文件所在目录,以及合并后的文件导出路径原创 2020-06-17 00:15:45 · 11117 阅读 · 1 评论 -
【日常】PySpark踩坑记
序言—— 有的事情不去尝试,就永远无法探知自我能力的极限将能触碰到何处。—— 有的事情不去尝试,也永远无法知悉“糟粕污秽”究竟能恶心到什么境地。—— 显然PySpark不能是前者【Facepalm】自从劲松加入了小米项目的团队后,MARS数据这个烂摊子就全落在笔者一个打杂的身上,幸好有提前做好和PySpark相关的功课,不至于接手的时候慌得手忙脚乱,上手两三天后越发地被PySpark这种生成任何数据表的结果只要一行代码就能写出来的简洁、优雅所吸引,感叹SQL确实是一门精妙的语言,实在是极大地原创 2020-06-12 01:38:21 · 12564 阅读 · 3 评论 -
【日常】PySpark包DataFrame相关处理小结
经过几日的不懈努力原创 2020-05-21 19:20:51 · 13304 阅读 · 1 评论 -
【置顶】囚生CYのPOST(NEW VERSION)
caoyang.log原创 2020-12-15 10:15:39 · 32713 阅读 · 6 评论 -
【Daily】Interested Bug in NetEase Online
Maybe English is the only open language in the world, where some blogs related to sensitive topics cannot be easily released in public using Chinese characters. Actually I just would like to share som...原创 2020-01-20 20:35:16 · 11055 阅读 · 1 评论 -
【日常】NaN
文章原标题:【日常】论如何在91flac上优雅地白嫖原文章没有过审,我觉得网站存在漏洞,就算我找不到,也有别人能找到,发现问题最终也是为了解决问题,如果只是一味的掩盖问题,不过是自欺欺人,千里之堤,溃于蚁穴罢了。既然如此,我就把原文章图片和代码放在这里,每张图片和代码都有标题,文字部分挂在GitHub上,大家想看的自取好了原文章文字链接或者可以移步https://blog.csdn...原创 2020-01-18 11:50:29 · 11830 阅读 · 1 评论 -
【日常】Geetest滑动验证码(三代canvas版)处理小结(以B站登录验证为例)
问题描述这个问题确实让我困扰了太长时间,今天花了半天时间,并没有找到非常完满的解决方案,只是在解决问题的过程中学会了一些其他知识,我最后还是要通过人工来判断大致的移动距离,然后根据误差做微调。大致做个总结了,并且认为网站如果真心愿意反爬虫,完全可以处理到让爬虫无懈可击。今年四月份时B站的Geetest验证码大致情况可以通过https://blog.youkuaiyun.com/CY19980216/a...原创 2019-12-01 21:28:51 · 12683 阅读 · 1 评论 -
【日常】如何处理“火星文”乱码
问题描述爬虫中常常会遇到两种乱码,一种是https://blog.youkuaiyun.com/CY19980216/article/details/103116623中遇到的乱码,严格来说这不是乱码,这是字符编码后的结果,而且它根本不乱,只是我们看不懂而已,但是计算机是可以轻易读懂它是什么意思的。第二种便是如下图所示的情况了????¡¾ÉϺ£ÕÐƸ£¬ÇóÖ°¡¿-Ç°³ÌÎÞÓÇ▽奻漆桸...原创 2019-11-22 20:29:34 · 15884 阅读 · 1 评论 -
【日常&问题解决】如何处理部分带有十六进制(以UTF-8编码为例)的文本转化处理
日前出游余杭,闲暇偶得此文。幸遇习缘君,方知此生不枉,欲与君同。问题发现这个问题起源于我用于刷访问量的博客https://blog.youkuaiyun.com/CY19980216/article/details/82825833,当然这个刷访问量的小爬虫之前也因为优快云自身更新出过一些小问题,不过最近它出了一个很恶心的问题。如下图所示????可能截图并不是看得那么清楚,我简要说明一下问题吧,如...原创 2019-11-18 19:20:12 · 12301 阅读 · 1 评论 -
【日常】浅谈项目经理与研发间的“代沟”
保研之后选择在学校教务处做助管,有点不思进取,主要觉得出去实习太累了,而且套路太深,与其给别人打工还不如给自家人打工,而且待遇也不差,工作时间也很理想,关键是压力小,之前在私募实习,老板就坐在你背后,敲几行代码都人头皮发麻。最近中国知网准备在本校推广他们的作业管理系统,宣称可以在检测出学生之间论文,报告甚至代码的抄袭(细思恐极)。CC把对接这事儿扔给我办了,第一次做乙方,想想还有些小激动。...原创 2019-11-09 10:53:01 · 11300 阅读 · 1 评论 -
【回归】闲来小憩信手拈
鸽了小半年,倒不是怠惰,计赛回来就是准备双专考试,结束已然是八月了。慌乱之中发现自己考研什么也没有准备;大学时间全用来参加各种竞赛,实习经历不是很充分,秋招也没有多少把握;只得赶紧刷起我最厌恶的题来准备十二月份的考研。黑暗的八月,喜怒无常,动辄大吼,时而颓唐,我痛恨刷题却无能为力,三年后我诚然还是只能屈服于应试教育。九月开学,推免资格的竞争开始了。我的学校只是个专科211,保研比例本来就不足1...原创 2019-10-13 11:09:46 · 10554 阅读 · 1 评论