前言
最近,许多小伙伴们发现一些优快云博客链接失效或被删除,导致无法查看这些文章的内容,甚至连标题,作者都无法得知。然而,我们可以利用优快云的某接口和搜索引擎的快照功能来解决这个问题。
实操
随着互联网的发展,优快云作为一个知识分享平台,承载了大量程序员和技术爱好者的精彩博客文章。然而,由于各种原因,有些博客链接可能会失效或被删除,给我们获取有价值的技术知识带来了一定的困扰。但是,幸运的是,读完这篇文章,你就知道该如何应对失效链接了!!
首先,我们需要获取失效链接的article_id。优快云的某接口可以帮助我们通过article_id获取到已失效博客链接的信息。通过这个接口,我们可以快速的通过标题得知该链接的内容。
我们接下来的例子是通过article_id为131349827的例子来获取这篇博客的信息。
有人一定会问,为什么你输入的是hxxps://blog.youkuaiyun.com/RabbitTuzi/article/details/131349827,是因为你只能获取自己发的文章吗???
那我们就应该先看一下优快云的文章访问机制了:
hxxps://blog.youkuaiyun.com/RabbitTuzi/article/details/131349827
在这个链接中,RabbitTuzi是用户名,131349827就是article_id。
那为什么我无法通过hxxps://blog.youkuaiyun.com/csdn/article/details/131349827来获取这篇文章?
因为优快云为了防止爬虫,在访问文章时并不是单纯的通过article_id,而是对username(发布文章用户)也做了匹配。所以我们得知用户名+文章编号才能访问这篇文章。
而本篇用到的这个接口只获取了article_id,并不会匹配username(发布文章用户)。
因此我们只需要构造一个虚假的用户名来绕过他的正则匹配。通过这个接口,我们甚至可以穷举文章编号批量获取发帖信息,根据发帖人+文章标题的联系数据来给每个发帖人打上一个技术标签 日后可以进行定向推送。
(孙子:哇靠,爷爷为什么你的优快云账号没有发布任何文章,人家说你是黑客啊)
言归正传,我们需要获取的是article为131349827的文章的信息。
通过这个接口我们获取到的信息有:
{"article_id":"131349827","score":11,"nickname":"谭XX",""title":"博客摘录「 MySQL日期时间操作函数(挺全的)」2023年6月23日","post_time":"2023-06-23 13:05:49","username":"qq_45630XXX"}
直接hxxps://blog.youkuaiyun.com/qq_45630XXX查看谭老师个人主页。
我们发现,谭老师把这篇文章删除之后就没有再发续集了。