首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何阻止来自特定目录的bot

如何阻止来自特定目录的bot
EN

Stack Overflow用户
提问于 2013-05-15 14:21:06
回答 1查看 309关注 0票数 0

在我的网站上的/cachecp/目录(该目录在我的服务器上不存在,但我假设它是寻找漏洞的黑客机器人)中,我收到了大量来自网络爬虫机器人的请求。IP都是完全不同的,所以我不能阻止IP。

我收到了这样的请求: mydomain.com/cachecp/helps/wholesale-plus-size-clothing.html,但是文件夹和html文件都不存在(或曾经存在)。html文件似乎完全是随机的,与我的产品没有任何关系。

我是否可以使用htaccess向任何试图访问该文件夹和/或禁止该IP多次尝试的机器人发送403错误?

EN

回答 1

Stack Overflow用户

发布于 2013-05-15 18:51:46

在您的robots.txt文件中使用它

代码语言:javascript
运行
复制
User-agent: *
Disallow: /cachecp/

请记住,robots.txt是一个“君子协议”,一些不太谨慎的机器人会完全无视你的规则。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/16558142

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档