如何在宝塔面板中屏蔽垃圾蜘蛛?

针对大量占用服务器资源的垃圾蜘蛛,如SemrushBot和AhrefsBot,可以通过在宝塔面板中操作进行屏蔽。具体方法是在www/server/nginx/conf目录下创建agent_deny.conf文件,并在网站配置中引入该文件,以阻止这些蜘蛛的访问。若要避免影响火车头采集发布,可以使用特定的代码配置。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近查看网站蜘蛛爬取情况,发现很多如SemrushBot、AhrefsBot之类的垃圾蜘蛛占比非常大,而且占用服务器资源。


网上搜索一番,找到了一个在宝塔面板中一劳永逸的方法。

在文件目录/www/server/nginx/conf文件夹下面,新建一个文件,命名为
agent_deny.conf
添加如下代码

#禁止Scrapy等工具的抓取

if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {

     return 403;

}

#禁止指定UA及UA为空的访问

if ($http_user_agent ~* "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|Bytespider|Ezooms|Googlebot|JikeSpider|SemrushBot|^$" ) {

     return 403;             

}

#禁止非GET|HEAD|POST方式的抓取

if ($request_method !~ ^(GET|HEAD|POST)$) {

    return 403;

}


找到网站设置里面的第7行左右,写入

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值