全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 430|回复: 5

求助PHP 采集大佬

[复制链接]
发表于 2020-3-19 21:49:26 | 显示全部楼层 |阅读模式
小弟最近想采集一个网站

发现网址内容页做了ajax 2次请求 然后内容拼接

现在什么都解决了

唯独这个第2次请求的 request headers 里面多了一个cookie

目前一直没有发现这个cookie 是怎么弄出来 (小弟才疏学浅,目前大概发现好像是 用6条字符串 拼接出来的, 其中2条为 response headers中的cookie 剩下全都不知 ,也不知道我的想法是不是对的~~~)

如果我想获取这个cookie  大佬有能教我的吗
~
php
php
php
php
php
php
发表于 2020-3-19 21:51:27 | 显示全部楼层
第一次请求之后 把 cookies 保存着,第二个模拟 ajax 请求时把 cookies 带上。
curl 之类的都可以管理 cookies
 楼主| 发表于 2020-3-19 22:05:09 | 显示全部楼层
Mr. 发表于 2020-3-19 21:51
第一次请求之后 把 cookies 保存着,第二个模拟 ajax 请求时把 cookies 带上。
curl 之类的都可以管理 cook ...

大佬
看来我没说清楚
我用fidder 抓包了
如果 headers 用 request headers 中的数据 已经抓取成功了
但是php 没办法获取 request headers 中的这个cookie 值啊
只能获取 response headers 中的cookie值

发表于 2020-3-19 22:08:51 | 显示全部楼层
wermnb 发表于 2020-3-19 22:05
大佬
看来我没说清楚
我用fidder 抓包了

request 是你发起的,你要带 cookie 就带 cookie,你不带就没有,如果你用 curl 抓数据,两次请求之间 cookie 是不共存的,所以第二次发起的 request 当然没有 cookie。
有些抓包工具是会对同一个域名的 cookie 默认做共享的,甚至还会使用浏览器里的 cookie(比如 postman),但代码不会啊,需要你自己指定 response 的 cookie 怎么保存、下一次 request 要不要带上 cookie。
发表于 2020-3-19 22:13:01 | 显示全部楼层
php弄cookie好像挺麻烦的,要自己拿正则表达式抠出来
发表于 2020-3-19 22:16:41 | 显示全部楼层
会走路的三百块 发表于 2020-3-19 22:13
php弄cookie好像挺麻烦的,要自己拿正则表达式抠出来

不需要,CURLOPT_COOKIEJAR 和 CURLOPT_COOKIEFILE 指定一个文件路径,就会在请求时自动带上、响应后自动写入了。如果多次请求在一起完成,直接用 curl_share_setopt 连设置 cookie 都省了。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-27 12:30 , Processed in 0.072066 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表