全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 1646|回复: 16

[疑问] 说一下狂雨和ptcms的区别

[复制链接]
发表于 2020-2-27 15:43:12 | 显示全部楼层 |阅读模式
问了人才知道的,大佬肯定都知道了,给想要自己建小说站小白看看

狂雨是采集到自己本地的,所以要的硬盘很大,我们假设一本小说是4mb左右,那么30万本就是120万mb,也就是1200 000mb,也就是1171.875千兆字节(gb),简单地说就是1T

有人问我有30万本小说吗,我可以确切的说,有的,来源某个采集电波群,具体不透露了,事实上很早的时候,约莫是在08年吧,黑龙小说网泄露出来的小说就有8万本了

至于ptcms就要求没那么大了,采集的都是链接,并不把数据存本地,这样数据容量轻松很多,我在某个群看到有人几百兆的空间数据库都能做ptcms,可见有多轻松。缺点也有,就是源站没了就完蛋,毕竟本地不存数据,另一方面对seo不友好,毕竟页面是生成的,百度google检测不到

大概是这样了,我想问问,可不可以针对某个年限对书进行采集,或者对历史上的榜单书籍进行采集,毕竟太垃圾的小说也没人看,索性就不要了,来减轻数据库压力,毕竟1T受不了啊
发表于 2020-2-27 15:45:09 来自手机 | 显示全部楼层
ptcms虚拟主机可以用吗 昨天狂雨卡最后一步了
发表于 2020-2-27 15:47:38 来自手机 | 显示全部楼层
这个要自己改代码吧
发表于 2020-2-27 15:48:45 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2020-2-27 16:01:08 | 显示全部楼层
如果是完整的txt方式存储,可以用gbk编码,比utf-8节省1/3的存储空间,还可以进一步压缩。

只是为了体验好,要做热点缓存,首次加载友好提示。
发表于 2020-2-27 16:03:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2020-2-27 16:52:44 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2020-2-27 17:22:12 | 显示全部楼层
大佬们最近为什么不讨论齐杰了
发表于 2020-2-27 17:45:44 来自手机 | 显示全部楼层
爱吃醋的醋醋 发表于 2020-2-27 16:52
杜甫无所畏惧,4T硬盘才存了300G

羡慕有杜甫的人
发表于 2020-2-27 18:32:55 | 显示全部楼层
你可以写抓取起点之类的排名然后来去使用小说站的搜索接口.采集对应的书,但是这东西好像关关无法实现.火车倒是OK的很~
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-20 02:46 , Processed in 0.067226 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表