全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1066|回复: 9

遇到一个奇怪的网站,请教下爬虫大佬

[复制链接]
发表于 2019-4-30 15:14:51 | 显示全部楼层 |阅读模式
本帖最后由 yy小马君 于 2019-4-30 15:17 编辑

rt,今天有个任务,需要爬一个网站:https://msyyl.ypzdw.com/

需要的是上图的商品信息,然后查看源码发现他是同步然后使用js渲染商品信息到页面
这样我就完全拿不到商品信息了,请问大佬们有没有什么好的解决方法?



查看network发现并不是异步加载js



其加载商品信息js
 楼主| 发表于 2019-4-30 15:17:46 | 显示全部楼层

只会java爬虫。。
发表于 2019-4-30 15:20:57 | 显示全部楼层
本帖最后由 三一土白 于 2019-4-30 15:22 编辑





数据全在这个网址中.
 楼主| 发表于 2019-4-30 15:25:06 | 显示全部楼层
三一土白 发表于 2019-4-30 15:20
数据全在这个网址中.

这个列表的数据不全,我需要进入到里面的数据。。
 楼主| 发表于 2019-4-30 15:29:37 | 显示全部楼层
三一土白 发表于 2019-4-30 15:20
数据全在这个网址中.


我需要的是这种格式的商品的url:https://kelun.ypzdw.com/0/279196,你刚刚给我看的是:https://www.ypzdw.com/product/24
不过还是非常感谢了
发表于 2019-4-30 15:31:15 | 显示全部楼层
本帖最后由 robot 于 2019-4-30 15:39 编辑

找到js就更简单了
一共就那么几条,没有什么找不到的
发表于 2019-4-30 15:32:40 | 显示全部楼层
yy小马君 发表于 2019-4-30 15:25
这个列表的数据不全,我需要进入到里面的数据。。

那进入那个页面,在这里面找的.

你肉眼能看到的数据,都在这里面,没什么找不到的.

我以前最笨的时候,是一个页面的response,复制粘贴出来,Ctrl +F找.从来没有找不到的.
发表于 2019-4-30 16:01:05 来自手机 | 显示全部楼层
三一土白 发表于 2019-4-30 15:32
那进入那个页面,在这里面找的.

你肉眼能看到的数据,都在这里面,没什么找不到的.

头像好猛
发表于 2019-4-30 16:04:23 | 显示全部楼层
这种最好做,直接把请求拿过来,返回过来的数据就是的了,不需要爬虫
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-20 01:57 , Processed in 0.065373 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表