全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
12
返回列表 发新帖
楼主: 可乐呀

关于SQL的导入

[复制链接]
 楼主| 发表于 2020-11-30 12:50:33 | 显示全部楼层
本帖最后由 可乐呀 于 2020-11-30 12:52 编辑
Qys 发表于 2020-11-30 03:31
我遍历所有行,检测一行是否只有"----",满足的话写进新的文件里,这样遍历一遍感觉也没多久 ...


我用Shell遍历了一遍正则匹配xxx-xxx,不匹配的输出到文件,从上午上课开始,到中午回来 看了看还没匹配到最后一行。。。
已经又26万行不匹配数据了,看了看有些数据确实不对,比如一两个数字----xxxxx
还有xxxxxxx-xxxxxxxx-xxxxxxxx
前两个段不一样
Linux Shell效率应该比Python高点吧
发表于 2020-11-30 12:59:32 | 显示全部楼层
本帖最后由 夏生啊 于 2020-11-30 13:05 编辑

处理文本文件速度很快的,我用python把十几个G的文件按开头数字分割也就用了十几分钟吧感觉。还是单线程处理。也有可能是我边玩手机边弄没注意时间,反正感觉挺短的,不至于一上午处理不完把。建议你在自己电脑上搞,别在VPS上性能不够。
 楼主| 发表于 2020-11-30 18:09:47 | 显示全部楼层
我用grep直接筛,两分钟筛完了不合法数据
用Shell自带的read line 然后 bash的=~匹配一下午才匹配完一半的行数
发表于 2020-11-30 18:13:30 | 显示全部楼层
是导入那个库吧?

我已导入, 方法是:

百度搜: 辅助者txt分割器, 然后分割成每个txt10w行,
分割后会生成1-5000.txt个文件,

然后就交给php的foreach 从1-5000循环, 然后写入mysql
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-5-25 04:07 , Processed in 0.056887 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表