Google的高级搜索查询语法
上面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信 息,你还需要了解更多的东西。
[intitle:]
“intitle:”帮助Google将搜索结果限制在那些标题中含有检索单词的页面。例如,“intitle:login password”(不包括引号)将返回标题中有单词“login”,页面中任何地方有单词“password”的那些页面的链接。
类似的,如果想在网页的标题中检索多个单词,可以用“allintitle”来代替“intitle”得到标题中包含所有这些单词的网页列表。例如使用 “intitle:login intitle:password”跟使用“allintitle:login password”是一样的。
[inurl:]
“inurl:” 将搜索结果限制在那些URL中含有检索单词的页面。例如:“inurl:passwd”(不包括引号)将返回URL中有“passwd”的那些页面的链 接。
类似的,如果想在URL中检索多个单词,可以用“allinurl”来代替“inurl”得到URL中包含所有检索单词的网页列表。例如 “allinurl:etc/passwd”会查找URL中包含“etc”和“passwd”的页面。单词之间的“/”会被Google忽略掉。
[site:]
“site:” 将限制Google只在特定的站点或域中检索关键词。例如:“exploits site:hackingspirits.com”(不包括引号)将在所有“hackingspirits.com”域的链接页面中查找关键词 “exploits”。“site:”和“hackingspirits.com”之间不应有空格。
[filetype:]
“filetype:” 将限制Google只在internet上搜索特定扩展名的文件(就是doc,pdf或者ppt等等)。例如:“filetype:doc site:gov confidential”(不包括引号)将在所有政府域相关的网站中查找页面中或“.doc”文件中包含关键词“confidential”的扩展名为 “.doc”的文件。也就是结果会包含到所有政府网站中有confidential关键词的文档的链接。
[link:]
“link:” 将显示有到指定网页的链接的网页。例如:“link:www.securityfocus.com”会列出有到SecurityFocus的链接的网页。 注意“link:”和网页url之间不应有空格。
[related:]
“related:” 将显示跟指定网页类似的网页。例如:“related:www.securityfocus.com”会列出跟SecurityFocus主页类似的网 页。注意“related:”和网页url之间不应有空格。
[cache:]
“cache:” 将显示在Google cache中的网页。例如:“cache:www.hackingspirits.com”会列出Google cache中hackingspirits的主页。注意“cache:”和网页url之间不应有空格。
如果查询串中包含其它词,Google会在cache的文档中高亮显示这些词。例 如: “cache:www.hackingspirits.com guest”会显示在cache中的网页内容,并高亮显示“guest”。
[intext:]
“intext:” 会在特定的网站中搜索单词。它忽略links或URL和页面标题。例如:“intext:exploits”(不包括引号)将只返回页面中含有搜索关键词 “exploits”的网页链接。
[phonebook:]
“phonebook:” 会搜索美国街道地址和电话号码信息。例如:“phonebook:Lisa+CA”会列出所有名字中有“Lisa”并且住在“加利福尼亚(CA)”的人的 名字。这对那些想要挖掘个人信息的黑客来说是再好不过的工具了。
6,其他重要功能
目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录 “http://directory.google.com/”,中 文目录是 “http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于 GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其 他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲 安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现 在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多, 所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提 供对关键字、新闻组、主题、作者、帖子序号、语言和发布日期的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在 alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的 拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面, http://www.google.com /preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见 GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是 ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurl:pdf ecommerce”
结果:已向英特网搜索inurl:pdf ecommerce. 共约有19,200项查询结果,这是第1-10项。搜索用时0.11秒。
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 - 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该 PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是 “images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成 两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚 扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
7.Google黑客揭秘
上面所说的Google查询语法能真正帮助人们来精确他们的搜索结果,得到他们真正想要的。
现在Google如此智能,黑客们当然不会介意利用它从互联网上来挖掘更多本来不应该让他们知道的保密和隐私的信息。现在我将要详细讨论这些技术,展示黑 客们是如何利用Google从网上挖掘信息的,以及如何利用这些信息来入侵远程服务器。
利用“index of”与发来查找开放目录浏览的站点
一个开放了目录浏览的WEB服务器意味着任何人都可以像浏览通常的本地目录一样浏览它上面的目录。这里我将讨论如何利用“index of”语法来得到开放目录浏览的WEB服务器列表。这对黑客来说是一种非常简单的信息搜集方法。试想如果得到了本不应该在internet上可见的密码文 件或其它敏感文件,结果会怎样。下面给出了一些能轻松得到敏感信息的例子。
Index of /admin
Index of /passwd
Index of /password
Index of /mail
"Index of /" +passwd
"Index of /" +password.txt
"Index of /" +.htaccess
"Index of /secret"
"Index of /confidential"
"Index of /root"
"Index of /cgi-bin"
"Index of /credit-card"
"Index of /logs"
"Index of /config"
利用“inurl”或“allinurl”寻找缺陷站点或服务器
a.利用“allinurl:winnt/system32/”(不包括引号)会列出所有通过web可以访问限制目录如“system32”的服务器的链 接。如果你很幸运你就可以访问到“system32”目录中的cmd.exe。一旦你能够访问“cmd.exe”,就可以执行它,瞧!服务器归你所有了。
b.利用“allinurl:wwwboard/passwd.txt”(不包括引号)会列出所有存在“WWWBoard 密码缺陷”的服务器的链接。想了解更多关于这个缺陷的知识,你可以参看下面的链接:http://www.securiteam.com /exploits/2BUQ4S0SAW.html
c.利用“inurl:bash_history”(不包括引号)会列出所有通过web可以访问“.bash_history”文件的服务器的链接。这是 一个历史命令文件。这个文件包含了管理员执行的命令列表,有时还包含敏感信息例如管理员输入的密码。如果这个文件被泄漏并且包含加密的unix密码,就可 以用“John The Ripper”来破解它。
d.利用“inurl:config.txt”(不包括引号)会列出所有通过web可以访问 “config.txt”文件的服务器的链接。这个文件包含敏感信息,包括管理员密码的哈希值和数据库认证凭证。例如:Ingenium Learning Management System是一个由Click2learn,Inc开发的基于Web的Windows应用程序。Ingenium Learning Management System5.1和6.1版本以非安全的方式在config.txt文件中存储了敏感信息。更多相关内容请参 看:http://www.securiteam.com/securitynews/6M00H2K5PG.html
其它类似的组合其它语法的“inurl:”或“allinurl:”用法:
inurl:admin filetype:txt
inurl:admin filetype:db
inurl:admin filetype:cfg
inurl:mysql filetype:cfg
inurl:passwd filetype:txt
inurl:iisadmin
inurl:auth_user_file.txt
inurl:orders.txt
inurl:"wwwroot/*."
inurl:adpassword.txt
inurl:webeditor.php
inurl:file_upload.php
inurl:gov filetype:xls "restricted"
index of ftp +.mdb allinurl:/cgi-bin/ +mailto
利用“intitle”或“allintitle”寻找缺陷站点或服务器
a. 利用[allintitle:“index of /root”](不包括括号)会列出所有通过web可以访问限制目录如“root”的服务器的链接。这个目录有时包含可通过简单Web查询得到的敏感信 息。
b. 利用[allintitle:“index of /admin”](不包括括号)会列出所有开放如“admin”目录浏览权限的WEB站点列表链接。大多数Web应用程序通常使用“admin”来存储管 理凭证。这个目录有时包含可通过简单Web查询得到的敏感信息。
其它类似的组合其它语法的“intitle:”或“allintitle:”用法:
intitle:"Index of" .sh_history
intitle:"Index of" .bash_history
intitle:"index of" passwd
intitle:"index of" people.lst
intitle:"index of" pwd.db
intitle:"index of" etc/shadow
intitle:"index of" spwd
intitle:"index of" master.passwd
intitle:"index of" htpasswd
intitle:"index of" members OR accounts
intitle:"index of" user_carts OR user_cart
allintitle: sensitive filetype:doc
allintitle: restricted filetype :mail
allintitle: restricted filetype:doc site:gov
其它搜索串
查找有跨站脚本漏洞(XSS)的站点:
allinurl:/script_s/cart32.exe
allinurl:/CuteNews/show_archives.php
allinurl:/phpinfo.php
查找有SQL注入漏洞的站点:
allinurl:/privmsg.php