[原创]关于Infobright 的几种数据格式

如果大家用到INFOBRIGHT,对这个字眼就不陌生了。 

 
目前有4种格式。
1. binary.
2. txt_variable
3. mysql
4. infobright
 
代表什么意思呢,我来详细解释下。
BINARY 代表二进制数据。 也就是说,原始数据是以特定格式的二进制来保存。 具体格式,可以参见官方的白皮书,很容易下载到。
 
TXT_VARIABLE 代表 CSV格式文本。默认的列分隔符为“;”。 
 
MYSQL 代表和MYSQL兼容的CSV格式文本。默认分隔符为“水平制表符“。
 
INFOBRIGHT 呢,代表分布式导入工具(DLP)生成的中间结果集, 只能用来导入DLP的中间数据。
 
 
这几种格式的载入速度按照以下顺序,由高到低排列:
INFOBRIGHT   --->   BINARY ---> TXT_VARIABLE ---> MYSQL。
可以看到MYSQL载入最慢。 但是MYSQL能打印出来更多的错误信息以供调试。
 
 
设置方法:
set @bh_dataformat = '随便一种';
即可。
 
 
 
 

 

本文出自 “上帝,咱们不见不散!” 博客,请务必保留此出处http://yueliangdao0608.blog.51cto.com/397025/887262

转载于:https://my.oschina.net/u/585111/blog/219477

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值