【已解决】小说爬虫疑问

Alanku · 发表于 2020-9-7 20:56:28

你得学一点html

pikiti · 发表于 2020-9-7 21:00:56

dl中把两个dt中间内容删掉就行了

pikiti · 发表于 2020-9-7 21:10:36

本帖最后由 pikiti 于 2020-9-8 11:49 编辑

拉倒

wqz · 发表于 2020-9-7 21:14:35

要不要试试参考一下阅读（安卓APP github或者酷安可下载）的书源？
我记得阅读的书源是有章节获取规则的
阅读：https://github.com/gedoor/legado
源仓库：http://yck.mumuceo.com/

laogui · 发表于 2020-9-7 21:24:13

把

复制代码

改为

复制代码

试试看

cgi · 发表于 2020-9-8 08:50:41

laogui 发表于 2020-9-7 21:24
把

改为

成了，多谢老哥，xpath和CSS 还可以一起用。

cgi · 发表于 2020-9-8 08:54:37

518 发表于 2020-9-7 20:09
43行改为

这个切片的意思就是前面12行不要是吧

绿豆 · 发表于 2020-9-8 08:56:02

马克一下，等大佬出现

518 · 发表于 2020-9-8 09:11:18

cgi 发表于 2020-9-8 08:54
这个切片的意思就是前面12行不要是吧

是，但是有些书章节少，要取长度//2和12最小值

复制代码

cgi · 发表于 2020-9-8 09:33:17

518 发表于 2020-9-8 09:11
是，但是有些书章节少，要取长度//2和12最小值

哦哦。明白了，谢谢

		自动登录	找回密码
密码			注册