Clinkhouse·文本数据导入数据库

这篇博客介绍了如何使用 ClickHouse 进行数据导入和导出,包括 TabSeparated 和 CSV 格式的转换。内容涵盖用 `sed` 命令替换文本分隔符、删除文件头、转换编码格式以及使用 `awk` 添加新列。还展示了通过 `clickhouse-client` 将数据导入 ClickHouse,并处理大文件时如何忽略错误。此外,涉及了查看文件部分内容和选择特定行的技巧。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Clinkhouse·文本数据导入数据库

TabSeparated – txt格式导入
CSV – txt格式导入
导入数据
cat uid_info.txt | clickhouse-client --query="INSERT INTO test.tmp_uid_info FORMAT TabSeparated"
导出数据
clickhouse-client --query="select * from test.tmp_uid_info FORMAT CSV" > uid_info.csv
替换文本分割符-将竖杠(|) 替换成逗号(,)
sed -i "s/|/,/g" 20220726.txt
将csv文件中的引号“ 替换成空
sed -i "s/\"//g" 202106-202203faultlist.csv
将文本gbk格式转换为utf-8
iconv list.csv -f gb18030 -t utf-8 -o list_2.csv
新增列指定值
awk '{print $0,",新增的列"}' h1.csv >h2.csv

文本内容出现^M 去除方法如下:vi进入文本按 esc 输入:%s/\r// 保存

-- 删除表头
sed -i '1d' "20462-202205.csv" // 删除第一行
sed -i '1d' "20464-202205.csv" // 删除第一行
sed -i '1d' "20465-202205.csv" // 删除第一行

head -n 100 "20464-202205.csv" // 查看前100行

-查看文件第几行到第几行
sed -n '5010,5020'p filename 
awk '{if(NR>=5010 && NR<=5020) print $0}' filename.csv

csv 文件导入数据库 
指定分割符参数
 --format_csv_delimiter="|" 

cat 20464-202205.csv  | clickhouse-client -h 127.0.0.1 -u default --password xpwd --database default --query "INSERT INTO rx_duizhang_20464 FORMAT CSV"
cat 20462-202205.csv  | clickhouse-client -h 127.0.0.1 -u default --password xpwd --database default --query "INSERT INTO rx_duizhang_20462 FORMAT CSV"
cat 20465-202205.csv  | clickhouse-client -h 127.0.0.1 -u default --password xpwd --database default --query "INSERT INTO rx_duizhang_20465 FORMAT CSV"

-- 导入大文件时报错,可以使用此命令忽略错误继续导入
cat filename.csv | clickhouse-client -h 127.0.0.1 -u default --password xpwd  --database default --input_format_allow_errors_num=1  --input_format_allow_errors_ratio=0.1 --query "INSERT INTO tablename FORMAT CSV"

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

青鸟遇鱼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值