全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
楼主: eqblog

关于javhd脚本的一些问题

[复制链接]
 楼主| 发表于 2018-3-14 22:16:47 | 显示全部楼层
流量之神 发表于 2018-3-14 22:03
请问这个脚本可以断点采集吗?第二次接着第一次的采集继续爬

不能 但是可以手动设置页数
发表于 2018-3-16 11:47:19 | 显示全部楼层
eqblog 发表于 2018-3-14 22:16
不能 但是可以手动设置页数

怎么样手动设置呢? 因为封了几个ip, 不想重复下载了
发表于 2018-3-16 14:37:23 | 显示全部楼层
openos 发表于 2018-3-16 11:47
怎么样手动设置呢? 因为封了几个ip, 不想重复下载了

flag 就是开始爬的页数。你查一下看你爬到哪个文件,搜一下在第几页,把记得flag设置在下一页,不然肯定ban
发表于 2018-3-16 14:45:29 | 显示全部楼层
我在本地爬了1380个视频,不知道全部视频有多少

点评

爬完1080的,2565个,网站上根据页面数来计算应该有2578个。  发表于 2018-3-17 02:20
如果你的都是1080的 1300多个肯定没全,我现在都有1300左右了,才爬到61页。  发表于 2018-3-16 16:48
发表于 2018-3-16 15:17:35 | 显示全部楼层
开了一个月会员,可惜这脚本还是有问题,哎
发表于 2018-3-16 15:35:12 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2018-3-16 15:37:19 | 显示全部楼层
zhp521163 发表于 2018-3-16 15:17
开了一个月会员,可惜这脚本还是有问题,哎

牛B啊,一个月会员$40?
发表于 2018-3-16 16:21:02 | 显示全部楼层
ehane 发表于 2018-3-16 14:37
flag 就是开始爬的页数。你查一下看你爬到哪个文件,搜一下在第几页,把记得flag设置在下一页,不然肯定b ...

如果要从60页开始,是改flag =60吗,改了后脚本一直没输出。改回原来=1,就可以正常输出信息
def run():
    s=spider(quality)
    reqget=s.req()
    flag=60
    while True:
        time.sleep(5)
        page=s.page(flag)
        info=s.find_info(page)
        for i in info:
            mp4_dict=s.find_mp4(i[0],reqget)
            tittle=i[1].strip()
            print(tittle)
            if os.path.exists(str(tittle)+'.mp4')==False:
                print(s.sources_mp4(mp4_dict,reqget))
                download(s.sources_mp4(mp4_dict,reqget),tittle)
            else:
                #continue
                time.sleep(time_sleep)
        flag+=1
        time.sleep(5)
发表于 2018-3-16 16:32:23 | 显示全部楼层
eqblog 发表于 2018-3-14 22:16
不能 但是可以手动设置页数

如果要从61页开始抓取,只要改下面这个flag的值吗 改了脚本似乎卡住没任何动静了

def run():
    s=spider(quality)
    reqget=s.req()
    flag=61
发表于 2018-3-16 16:51:58 | 显示全部楼层
本帖最后由 itsme 于 2018-3-18 05:26 编辑

本帖没内涵
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-27 12:46 , Processed in 0.066162 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表