全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
123
返回列表 发新帖
楼主: eqblog

深夜再发一次javhd的爬虫,更新了cookie【更新时间 2018年3月...

[复制链接]
 楼主| 发表于 2018-3-7 20:55:20 | 显示全部楼层
bigboss60 发表于 2018-3-7 20:54
要先在运行脚本的电脑上登录账号获取Cookies是吗?想在VPS运行但没桌面运行浏览器啊 ...

直接运行新脚本就好了。不需要获取。。我用的是我的账户
发表于 2018-3-7 21:11:56 | 显示全部楼层
爬到的只是30多M的视频
发表于 2018-3-7 21:24:42 | 显示全部楼层
eqblog 发表于 2018-3-7 20:55
直接运行新脚本就好了。不需要获取。。我用的是我的账户

下了都是30M左右的视频,都打不开
 楼主| 发表于 2018-3-7 21:27:34 | 显示全部楼层
nerlnsqy 发表于 2018-3-7 21:11
爬到的只是30多M的视频

那就说明我的会员到期了。或者cookie失效
发表于 2018-3-7 22:42:10 | 显示全部楼层
本帖最后由 ru1404 于 2018-3-7 22:55 编辑

  首先报错
File "spider.py", line 39
SyntaxError: Non-ASCII character '\xe6' in file spider.py on line 39, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details


解决文字编码 又出现错误 环境是centos 6.9   windows 没有问题

Traceback (most recent call last):
  File "spider.py", line 79, in <module>
    run()
  File "spider.py", line 68, in run
    info=s.find_info(page)
  File "spider.py", line 15, in find_info
    info=re.findall(r'clickitem="(.*?)".*?t ">\n(.*?)\n.*?</span>',str(req.text),re.M)
UnicodeEncodeError: 'ascii' codec can't encode characters in position 1818-1821: ordinal not in range(128)

发表于 2018-3-7 22:54:36 | 显示全部楼层
wget必须分享起来!
发表于 2018-3-12 20:02:54 | 显示全部楼层
cookie失效是什么意思啊。我爬到600G多后,被自动killed掉了。
vps上再运行脚本,没任何输出信息,自己pc上通过vps的代理去登录会提示:
Confirm your activity
We apologize for the inconvenience but some your recent activity looks as if it may have been scripted. We would like to confirm that your activity is real.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-19 00:29 , Processed in 0.062607 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表