全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1490|回复: 2

请教下 python BeautifulSoup4 取链接

[复制链接]
发表于 2018-4-12 23:17:48 | 显示全部楼层 |阅读模式
本帖最后由 mingtian 于 2018-4-12 23:20 编辑

<article class="am-g">
<div class="am-u-sm-2">
<a href="/book/3033"><img src="http://baidu.com/3/3033/3033s.jpg" alt="魔牌明月" class="am-img-thumbnail am-radius am-list-img am-list-img"> </a>
</div>
<div class="am-list-info am-u-sm-10">
<div class="am-list-info-right">
<a href="/book/3033">
<h3 class="am-list-title am-text-truncate">魔牌明月</h3>
</a>
<span class="am-list-update am-text-truncate">
连载中 </span>
<span class="am-list-author am-text-truncate">
<p>作者: </p><strong>吕南明</strong>
</span>

<div class="am-list-info-p am-list-line-clamp">
---本书已经上架,求订阅,求贵宾,求盖章......谢谢!
</div>

</div>
<div class="am-list-info-last am-text-xs">
<p>最新章节: </p><strong><a href="/read/3033/780137">第五百一十章 完本感言</a></strong>
</div>
</div>
</article>

需要从这里获取到a链接
<a href="/book/3033"><img src="http://baidu.com/3/3033/3033s.jpg" alt="魔牌明月" class="am-img-thumbnail am-radius am-list-img am-list-img"> </a>

也就是获取/book/3033

才接触这个。没看懂。懂的朋友说下 有几种方法取出这个链接


这样取出来 for mulu1 in soup.select('.am-u-sm-2 a')[0]['href']

居然是竖着一行。。
/
b
o
o
k
/
3
0
3
3

就是这样 不知道为啥


发表于 2018-4-13 19:40:31 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2018-4-13 22:45:55 | 显示全部楼层
大风起 发表于 2018-4-13 19:40
[code]
import lxml.html as lh
html = '''

嗯 多谢  

才接触的。。慢慢琢磨
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-25 22:29 , Processed in 0.057415 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表