google hack 语法
如何使用google,对于google这个浏览器不想多说:
推荐百度google镜像站关键字,总有一个能用的.
如: intitle:google镜像站 语法和关键字之间不要存在空格
初级:
- filetype: 锁定搜索文件的后缀名或者是扩展名,如: filetype:php,asp,txt,xls,xlsx
- intitle: 锁定标题,如: intitle:侠客行
- inurl: 锁定url或?后的关键字,如: inurl:baidu.com inurl:robots.txt
- intext: 锁定正文内容,如: intext:十步杀一人
- site: 锁定范围.如:限定再百度网站下查询,site:baidu.com 锁定一级域名baidu.com,查询baidu.com域名下的一二三级域名包含信息.
- 双引号: 精确查询
- 乘号: 通配符
- 英文句号: 单一通配符
- 加号: 强制锁定,即必须包含加号后面的内容
- 减号: 可忽略
举个栗子:
-
查询1.标题带有后台管理字段 2.网站为php编写的.
-
查询1.www.jsjhgk.com的url链接下 2.标题带有后台管理字段 3.网站为php编写的.
-
用site进行限制范围
4.intext查询内容关键字
5.双引号,精确查询,不会出现,后台,管理累死的模糊分词.
以上网站均为google镜像随机搜索若有侵权,请告知撤销!!!
注:
1.robots.txt应放置于网站的根目录下。robots协议并不是一个规范,而只是约定俗成.
2.在robots.txt这个文件中网站管理者可以声明该网站中不想被robots访问的部分,或者指定搜索引擎只收录指定的内容。
3.robots是网站跟爬虫间的协议,用简单直接的txt格式文本方式告诉对应的爬虫被允许的权限,也就是说robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。