通过html标签限制搜索引擎

本文介绍如何使用meta标签和robots.txt文件来控制搜索引擎对网站页面的抓取和索引,包括禁止建立快照、禁止抓取等具体操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


======================================================
注:本文源代码点此下载
======================================================

网页未制作完成,或涉及隐私不能公布,限制搜索引擎收录

第一种情况:限制网页快照

限制所有的搜索引擎建立网页快照:

限制百度的搜索引擎建立网页快照:

第二种情况 :禁止搜索引擎抓取本页面,禁止搜索引擎引用页面

在这里,meta name="robots"是泛指所有的搜索引擎的,在这里我们也可以特指某个搜索引擎,例如meta name="googlebot"、meta name="baiduspide"、meta name="www.nfrencai.com"等。

content部分有四个命令:index、noindex、follow、nofollow,命令间以英文的“,”分隔。

index命令:告诉搜索引擎抓取这个页面

follow命令:告诉搜索引擎可以从这个页面上找到链接,然后继续访问抓取下去。

noindex命令:告诉搜索引擎不允许抓取这个页面

nofollow命令:告诉搜索引擎不允许从此页找到链接、拒绝其继续访问。

根据以上的命令,我们就有了一下的四种组合

:可以抓取本页,而且可以顺着本页继续索引别的链接

:不许抓取本页,但是可以顺着本页抓取索引别的链接

:可以抓取本页,但是不许顺着本页抓取索引别的链接

:不许抓取本页,也不许顺着本页抓取索引别的链接。

通过robots.txt

所谓的robots.txt文件,是每一个搜索引擎到你的网站之后要寻找和访问的第一个文件,robots.txt是你对搜索引擎制定的一个如何索引你的网站的规则。通过这个文件,搜索引擎就可以知道在你的网站中,哪些文件是可以被索引的,哪些文件是被拒绝索引的。


======================================================
在最后,我邀请大家参加新浪APP,就是新浪免费送大家的一个空间,支持PHP+MySql,免费二级域名,免费域名绑定 这个是我邀请的地址,您通过这个链接注册即为我的好友,并获赠云豆500个,价值5元哦!短网址是http://t.cn/SXOiLh我创建的小站每天访客已经达到2000+了,每天挂广告赚50+元哦,呵呵,饭钱不愁了,\(^o^)/
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值