全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 2181|回复: 13

[Windows VPS] [已解决]再次求教,火车头如何采集跳转之后的新的url

[复制链接]
发表于 2019-5-11 16:23:51 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2019-5-11 16:56:54 | 显示全部楼层
多页,付费版可以,开心版可以
 楼主| 发表于 2019-5-11 17:16:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2019-5-11 17:29:20 | 显示全部楼层
你不上网址的话  很难知道具体什么回事的  不过你采集网址也简单

火车头直接匹配多页 可以直接获取当前页面的url
发表于 2019-5-11 17:35:04 | 显示全部楼层
用 高级功能的 http请求
发表于 2019-5-11 17:37:19 | 显示全部楼层
bob1987 发表于 2019-5-11 17:16
多页测试无效。。。只能采集跳转的新页面的内容,但是无法获取到url

用php写个页面解决,采集的时候多页地址直接填你的php程序,后面加采集地址url参数。
发表于 2019-5-11 17:40:04 | 显示全部楼层
本帖最后由 amo 于 2019-5-11 17:46 编辑

是不是点击之后跳转到百度网盘了?
这种可以先把请点击此处这个链接下载下来
例如
  1. http://***/down.php?id=1
  2. http://***/down.php?id=2
  3. http://***/down.php?id=3
  4. http://***/down.php?id=4
复制代码

然后用form提交,再使用网站的cookie,就能批量获取到百度网盘地址了

index.html

  1. <form action="cj.php" method="post">
  2. <textarea rows="50" cols="120" name="keywords">

  3. </textarea>
  4.   <input type="submit" value="Submit" />
  5. </form>
复制代码

  1. $keyword_list = trim($_REQUEST['keywords']);
  2. $str_array = explode("\r\n", $keyword_list);




  3. foreach ($str_array as $value) {  
  4.     $curlPost=$value;  
  5.     $ch = curl_init($curlPost) ;   
  6.   curl_setopt($ch,CURLOPT_RETURNTRANSFER,true);
  7. curl_setopt($ch,CURLOPT_HEADER,true);
  8. curl_setopt($ch, CURLOPT_NOBODY, 1);
  9. //curl_setopt($ch,CURLOPT_HTTPHEADER,$header);
  10. curl_setopt($ch,CURLOPT_COOKIE,'填写网站cookie');
  11. curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);

  12. $content = curl_exec($ch);
  13. $info = curl_getinfo($ch,CURLINFO_EFFECTIVE_URL);
  14. curl_close($ch);
  15. echo $info.'<br />';
  16.   
  17.   

  18. }
复制代码




吧采集的下载链接弄个excel,在复制到表单里,批量获取百度网盘地址

上面是我之前采集一个点击下载跳转到百度网盘的代码

 楼主| 发表于 2019-5-11 17:58:36 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2019-5-11 18:02:35 | 显示全部楼层
你采集的资源看起来有点像爱情动作片
 楼主| 发表于 2019-5-11 19:14:52 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-27 05:30 , Processed in 0.096670 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表