在网站的域名后加上/robots.txt
http://www.taobao.com/robots.txt
User-agent: Baiduspider #百度爬虫
Allow: /article #允许访问 /article.htm
Allow: /oshtml #允许访问 /oshtml.htm
Allow: /ershou #允许访问 /ershou.htm
Allow: /$ #允许访问根目录,即淘宝主页
Disallow:
本文介绍了Robots协议的重要性和使用方法,通过示例解析了如何在网站域名后添加/robots.txt文件,以控制搜索引擎爬虫的行为,保护网站数据的隐私和优化SEO策略。
在网站的域名后加上/robots.txt
http://www.taobao.com/robots.txt
User-agent: Baiduspider #百度爬虫
Allow: /article #允许访问 /article.htm
Allow: /oshtml #允许访问 /oshtml.htm
Allow: /ershou #允许访问 /ershou.htm
Allow: /$ #允许访问根目录,即淘宝主页
Disallow:

被折叠的 条评论
为什么被折叠?