【网络安全 | CTF】攻防世界 robots 解题详析

秋说

已于 2024-05-31 09:48:50 修改

阅读量6.4k

点赞数

CC 4.0 BY-SA版权

分类专栏： CTF新手入门实战教程文章标签： CTF 网络安全

于 2023-05-20 21:59:51 首次发布

原创文章，禁止转载，否则保留追究法律责任的权利。

本文链接：https://blog.youkuaiyun.com/2301_77485708/article/details/130786379

CTF新手入门实战教程专栏收录该内容

80 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文详细分析了一次网络安全的CTF比赛中的robots解题过程。通过查看靶机空白页面的源代码，了解到robots.txt的作用是指导搜索引擎爬虫抓取网页的规则。示例中，`/private/`和`/admin/`被禁止抓取。通过GET请求，揭示了被设置为禁止爬取的页面。

文章目录

- robots.txt
- 姿势

题目描述：X老师上课讲了Robots协议，小宁同学却上课打了瞌睡，赶紧来教教小宁Robots协议是什么吧。

进入靶机，页面空白。
查看页面源代码：
在这里插入图片描述再次结合题目Robots协议

robots.txt

robots.txt是一种文本文件，用于告知搜索引擎爬虫哪些页面可以被抓取、哪些页面不应被抓取。通常，网站管理员会在网站的根目录下放置一个名为robots.txt的文件，并使用该文件指定他们希望搜索引擎索引和不索引的页面。

下面是一个简单的robots.txt示例：

User-agent: *
Disallow: /private/
Disallow: /admin/

这个示例中，User-agent: *指定所有搜索引擎爬虫，而Disallow: /private/和Disallow: /admin/则指示搜索引擎不要抓取网站中包含在/private/和/admin/文件夹中的任何内容。

姿势

GET：/robots.txt

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

秋说 感谢打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。