对于大数据中的一些特殊维表,有时候需要导入文档数据进去。对于批量导入数据,我们建议用指令导进去,这样速度可以非常快。
我们一般会有这样的流程:
(1)首先我们在execl中处理相关数据,每个字段的顺序都要一一与数仓中的表对应。整理好后导出为csv文件。
(2)将导出的csv文件使用类似NotePad++的工具进行编辑,将“,”替换成数仓中设置的隔开符(比如/t)。如果有中文,还需要另存utf-8格式。
(3)将修改后的csv文件另存为txt文件格式。
(4)将该txt文件放置到服务器某个路径,然后执行该指令进行覆盖
load data local inpath '放置的文件路径/suncat.txt' overwrite into table 数仓中某张表;
831

被折叠的 条评论
为什么被折叠?



