全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 881|回复: 7

[Windows VPS] 优Python大佬在吗?请教个问题

[复制链接]
发表于 2020-1-18 10:17:11 | 显示全部楼层 |阅读模式
目前有几百个url需要用requests请求并把返回的数据保存到数据库里。
循环这些地址的时候需要来一个time.sleep吗?
cherbim 该用户已被删除
发表于 2020-1-18 10:21:20 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2020-1-18 10:22:17 | 显示全部楼层
服务器没什么限制的话,尽量多线程呗
如果有限制特定时间内的连接数,那就随机time.sleep秒数好了
 楼主| 发表于 2020-1-18 10:29:13 | 显示全部楼层
cherbim 发表于 2020-1-18 10:21
你要明白time.sleep什么意思,要是网站没限制,就不需要,要是频繁访问网站会限制,就随机加个睡眠时间,伪 ...

是的,明白了。
发表于 2020-1-18 11:00:07 | 显示全部楼层
别爬的太快可能会导致封了ip
发表于 2020-1-18 11:26:07 来自手机 | 显示全部楼层
如果不是同一个网站,那不会有限制呀,相当于同一个网站只是访问了一次。
发表于 2020-1-18 11:26:50 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2020-1-18 11:27:15 来自手机 | 显示全部楼层
爬虫的话建议上异步哦,这种io阻塞最适合async了,效率杠杠的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-3-29 00:07 , Processed in 0.062423 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表