题目中提示查看robots。
robots.txt(统一小写)是一种存放于网站根目录下的ASCII编码的文本文件
robots协议,又叫爬虫协议,它告诉搜索引擎哪些网页可以抓取,哪些不可以
解题思路:
dirsearch扫描看是否存在robots.txt
若存在,/robots.txt访问
Allow参数表示可以抓取的网页,而Disallow参数表示不可抓取的网页,这类网页只可通过网址访问
由dirsearch扫描可得,存在robots.txt
User-agent 表示的是哪些爬虫,可以指定,也可以用 * 表示所有爬虫;
Disallow 表示的不允许访问资源的目录,若为 / 则表示所有目录均不允许访问。
该题表示允许所有爬虫访问,但禁止访问flagishere.txt
直接打开即可