攻防世界web练习14

原创于 2022-07-13 16:51:02 发布 · 155 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#搜索引擎 #爬虫 #web安全

本文介绍了一个关于Web安全的练习，重点是理解robots.txt协议的工作原理和目的。robots.txt是一个用于指示搜索引擎哪些页面可抓取、哪些禁止抓取的文件。虽然该协议不具备强制执行力，但通常被搜索引擎遵循。通过访问提供的链接并了解如何利用robots.txt，你可以学习如何保护网站的隐私并控制搜索引擎的抓取行为。完成练习后，你将能够更好地理解和应用robots协议。

攻防世界web练习

十四、Training-WWW-Robots（训练网站robots协议）

http://111.200.241.244:63550/

【原理】

robots.txt

robotsrobots.txt一般指robots协议。
协议也称爬虫协议、爬虫规则,是指网站可建立一个robots.txt文件来告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取,搜索引擎则通过读取robots.txt文件来识别这个页面是否允许被抓取。但是,这个robots协议不是防火墙,也没有强制执行力,搜索引擎完全可以忽视robots.txt文件去抓取网页的快照。
如果想单独定义搜索引擎的漫游器访问子目录时的行为，那么可以将自定的设置合并到根目录下的robots.txt，或者使用robots元数据（Metadata，又称元数据）。
robots协议并不是一个规范，而只是约定俗成的，所以并不能保证网站的隐私。

【目的】

学习robots.txt

【环境】

windows

【工具】

浏览器

【步骤】

输入/robots.txt
然后打开fl0g.php就可以看到flag

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。