大米CMS官网论坛,大米站长联盟,大米站长之家,大米开发者社区

标题: nginx禁止机器人访问网站 [打印本页]

作者: 追影    时间: 2023-4-25 16:38
标题: nginx禁止机器人访问网站
本帖最后由 追影 于 2023-5-15 20:41 编辑
  1. #禁止Scrapy等工具的抓取
  2.    if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {
  3.      return 403;
  4.     }

  5.   #禁止指定UA及UA为空的访问
  6.    if ($http_user_agent ~* "YandexBot|Bytespider|FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|Ezooms|^[        DISCUZ_CODE_0        ]quot; ) {
  7.      return 403;
  8.    }
  9.    #禁止非GET|HEAD|POST方式的抓取
  10.     if ($request_method !~ ^(GET|HEAD|POST)$) {
  11.       return 403;
  12.     }
复制代码
APACHE用rewrite实现:
  1. RewriteEngine On
  2. <blockquote>RewriteCond %{HTTP_USER_AGENT} ^.*(spider|bot|slurp).*$ [NC]
复制代码









欢迎光临 大米CMS官网论坛,大米站长联盟,大米站长之家,大米开发者社区 (https://www.damicms.com/bbs/) Powered by Discuz! X3.1