全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1164|回复: 12

[Windows VPS] 如何限制这类爬虫

[复制链接]
发表于 2019-5-3 19:40:22 | 显示全部楼层 |阅读模式



47.98.60.52 - - [03/May/2019:15:28:44 +0800] "GET /archives91660.html HTTP/1.1" 301 178 "-" "Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D))"
47.98.60.52 - - [03/May/2019:15:28:45 +0800] "GET /archives6652.html/amp HTTP/1.1" 499 0 "-" "Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D))"
47.98.60.52 - - [03/May/2019:15:28:45 +0800] "GET /archives6751.html HTTP/1.1" 499 0 "-" "Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D))"
47.98.60.52 - - [03/May/2019:15:28:45 +0800] "GET /archives9224.html HTTP/1.1" 301 178 "-" "Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D))"
47.98.60.52 - - [03/May/2019:15:28:45 +0800] "GET /archives925.html/amp HTTP/1.1" 301 178 "-" "Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D))"



都是以为 "Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D))"
作为伪装的
发表于 2019-5-3 19:43:11 | 显示全部楼层
直接封IP不好嘛
发表于 2019-5-3 19:44:39 | 显示全部楼层
一般防护:限制IP访问频率
高级防护:返回假数据

如果你的数据比较值钱可以返回假数据,这种真假混合的脏数据才是爬虫最烦的
 楼主| 发表于 2019-5-3 19:48:30 | 显示全部楼层

好像封不了IP啊
发表于 2019-5-3 19:54:50 | 显示全部楼层
这个特征这么明显,直接禁了就好了
 楼主| 发表于 2019-5-3 20:00:49 | 显示全部楼层
qytang 发表于 2019-5-3 19:54
这个特征这么明显,直接禁了就好了

请教宝塔面板可以禁止此IP?
发表于 2019-5-3 20:14:19 来自手机 | 显示全部楼层
直接ua屏蔽,安卓4.1已经淘汰,基本不可能存在误封真人的可能
 楼主| 发表于 2019-5-3 20:20:11 | 显示全部楼层
chen8700 发表于 2019-5-3 20:14
直接ua屏蔽,安卓4.1已经淘汰,基本不可能存在误封真人的可能

if ($http_user_agent ~* "Android 4.1.1") {
return 403;
}

这样对吗?请教?
发表于 2019-5-3 20:23:11 | 显示全部楼层
chengslier 发表于 2019-5-3 20:20
if ($http_user_agent ~* "Android 4.1.1") {
return 403;
}

yes
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-26 06:51 , Processed in 0.090506 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表