全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 788|回复: 13

关于SQL的导入

[复制链接]
发表于 2020-11-29 22:58:32 | 显示全部楼层 |阅读模式
本帖最后由 可乐呀 于 2020-11-29 22:59 编辑

最近楼主在学习SQL
这边有一个719806832行大小十多G的txt文件。
我用LOAD DATA INFILE导入到MySQL在某一行发生了错误

主要是格式问题

正确的格式是 xxxx----xxxx
我用sed看了下这一行格式变成xxxx----xxxx----xxxx导致出错。



请问各位大佬这种情况是不是只能用Shell或者Pyhon进行一些行格式不对的进行修正后再导入?(这样修正遍历每一行是不是会很慢)


本贴遵纪守法,绝对和一些违法的东西无关
发表于 2020-11-29 23:04:47 | 显示全部楼层
https://www.hostloc.com/forum.php?mod=viewthread&tid=772196
 楼主| 发表于 2020-11-29 23:10:52 | 显示全部楼层
落叶随风 发表于 2020-11-29 23:04
https://www.hostloc.com/forum.php?mod=viewthread&tid=772196

这个大佬的方法就是忽略了一些无效行吗
发表于 2020-11-29 23:32:33 | 显示全部楼层
可乐呀 发表于 2020-11-29 23:10
这个大佬的方法就是忽略了一些无效行吗


好像只是忽略了,我今天用python处理了下也确实遇到这个问题,一行会出现两个 '----',第一和第二都是qq,但是花了大概3个小时......,所以还是用楼上那位发的方案导入快一点。
 楼主| 发表于 2020-11-30 00:25:48 来自手机 | 显示全部楼层
本帖最后由 可乐呀 于 2020-11-30 00:31 编辑
落叶随风 发表于 2020-11-29 23:32
好像只是忽略了,我今天用python处理了下也确实遇到这个问题,一行会出现两个 '----',第一和第二都是qq ...


我用正则匹配了下,发现中间有一部分的数据都是两边qq号的数据
发表于 2020-11-30 00:26:50 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2020-11-30 00:39:38 | 显示全部楼层
python遍历一遍好像也就5分多钟,不慢的
发表于 2020-11-30 01:21:45 | 显示全部楼层
Qys 发表于 2020-11-30 00:39
python遍历一遍好像也就5分多钟,不慢的

哪有?单线程绝对不止。多线程考虑全局锁懒得写,直接导文件了
发表于 2020-11-30 03:31:36 | 显示全部楼层
cobra1 发表于 2020-11-30 01:21
哪有?单线程绝对不止。多线程考虑全局锁懒得写,直接导文件了

我遍历所有行,检测一行是否只有"----",满足的话写进新的文件里,这样遍历一遍感觉也没多久
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-5-11 11:05 , Processed in 0.065659 second(s), 10 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表