全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
楼主: Telegramr

[疑问] 问个PHP获取网页源代码的问题

[复制链接]
发表于 2024-4-13 17:56:06 来自手机 | 显示全部楼层
这种页面会有各种限制的,多访问几下。直接浏览器都不让访问。直接找api接口。
 楼主| 发表于 2024-4-13 18:09:35 | 显示全部楼层
似毛非毛 发表于 2024-4-13 17:56
这种页面会有各种限制的,多访问几下。直接浏览器都不让访问。直接找api接口。 ...

我试过很多次了,但是要么是空白,要么是302
发表于 2024-4-13 18:17:15 来自手机 | 显示全部楼层
我本地小鸡和国外小鸡试了,不加ua.302。加了ua返回一个特定的404页面
 楼主| 发表于 2024-4-13 18:19:01 | 显示全部楼层
似毛非毛 发表于 2024-4-13 17:56
这种页面会有各种限制的,多访问几下。直接浏览器都不让访问。直接找api接口。 ...

这命令在cmd下执行,404,我在debian下运行却没有事
curl --user-agent "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36" https://www.ip138.com/iplookup.php?ip=110.242.68.66&action=2
 楼主| 发表于 2024-4-13 18:23:26 | 显示全部楼层

用浏览器来打开,也是404了
发表于 2024-4-13 18:29:58 | 显示全部楼层
这种工具类,要么买接口,要么下免费库自己解析。
不要想着一个curl就白piao,谁也不傻,早都做限制了
发表于 2024-4-13 18:44:09 | 显示全部楼层
Telegramr 发表于 2024-4-13 18:23
用浏览器来打开,也是404了

额,好像是他们网站挂了吧,我这也是404
发表于 2024-4-13 18:53:15 | 显示全部楼层
pc访问页面也是404,
发表于 2024-4-13 19:10:23 | 显示全部楼层
301和302的状态码是临时重定向,会用 到CURLOPT_FOLLOWLOCATION选项

伪装UA和Referer,使用cookie如果依然404,网站可能使用了防爬虫机制,需要 IP代理池。话说为个ip有必要吗
发表于 2024-4-14 10:20:13 | 显示全部楼层
第三个 www.ipshudi.com 我用php实现过 是可以获取的 但是有时候会出现跳转的问题 正常访问有时候也会这样
应该是做了限制
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-30 07:36 , Processed in 0.061242 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表