StarRocks数据导入

StarRocks数据导入

Broker Load

使用 broker load 导入 hdfs 文件,需要在 Be 和 Broker 的 conf 目录中添加 HDFS的 hdfs-site.xml、core-site.xml、hive-site.xml ,配置HDFS集群 hosts 。

-- hive建表  creation_month为分区字段
CREATE TABLE `ads_crm_sales_visit_statistics_details2`(
  `id` string COMMENT '拜访id', 
  `sales_id` bigint COMMENT '销售id', 
  ... 
  `exception_elimination` bigint COMMENT '客户统计异常拜访1表示是要排除的0表示不排除', 
  `row_id` bigint COMMENT '虚拟主键')
COMMENT '销售异常拜访-拜访临时表'
PARTITIONED BY ( 
  `creation_month` string COMMENT '创建月份')

-- 查看hive表分区
show partitions ads_crm_sales_visit_statistics_details2;
-- SR建表  creation_month为排序键和分区字段
CREATE TABLE `ads_crm_sales_visit_statistics_details2` (
  `creation_month` date ,
  `creation_date` string ,
  `id` string , 
  `sales_id` bigint , 
  ..... 
  `exception_elimination` bigint , 
  `row_id` bigint  
) ENGINE=OLAP 
DUPLICATE KEY(`creation_month`, `creation_date`)
PARTITION BY RANGE(`creation_month`)
(
START ("2022-05-01") END ("2023-02-01") EVERY (INTERVAL 1 MONTH)
)
DISTRIBUTED BY HASH(`row_id`) BUCKETS 6 
;

ETL 集群导数

使用 broker load 导入 hdfs 文件,需要在 Be 和 Broker 的 conf 目录中添加 HDFS的 hdfs-site.xml、core-site.xml、hive-site.xml ,配置HDFS集群 hosts 。

[ 开通 S

你遇到的错误 `net::ERR_INVALID_HTTP_RESPONSE` 通常表示浏览器收到了无效的 HTTP 响应,可能是服务器没有正确返回 HTTP 头信息,或者根本没有返回数据。对于访问 StarRocks 数据导入接口出现的此类问题,可以从以下几个方面排查: ### 1. **检查后端服务是否正常运行** - 确保 StarRocks 的 FE(Frontend)和 BE(Backend)服务已经正常启动。 - 检查 StarRocks 的日志文件(如 `fe.log` 或 `be.INFO`),看是否有接口调用异常或启动失败的记录。 ### 2. **检查接口地址和端口是否正确** - 确认你访问的 URL 地址和端口是正确的。StarRocks 默认的编辑日志端口是 `9110`,RPC 端口是 `9020`,查询端口是 `9030`。 - 如果是导入接口,通常是通过 `Stream Load` 方式导入数据,地址格式如下: ``` http://<fe_host>:<edit_log_port>/api/<db>/<table>/_stream_load ``` ### 3. **检查网络连接** - 使用 `curl` 或 Postman 测试接口是否可达: ```bash curl --location-trusted -u <username>:<password> -H "label:123" -T data.file http://<fe_host>:<edit_log_port>/api/<db>/<table>/_stream_load ``` - 检查是否被防火墙或安全组限制访问。 ### 4. **检查浏览器跨域问题** - 如果你是通过前端网页访问 StarRocks 接口,可能存在跨域(CORS)问题。建议通过后端代理访问,或在 StarRocks 配置中开启跨域支持。 ### 5. **检查 StarRocks 配置** - 查看 `fe.conf` 中是否配置了正确的 `rpc_port` 和 `edit_log_port`。 - 确保配置文件中没有语法错误。 --- ### 示例:使用 curl 进行 Stream Load 导入测试 ```bash curl --location-trusted -u root: -H "label:example_label" -H "column_separator:," -T data.csv http://127.0.0.1:9110/api/example_db/example_table/_stream_load ``` --- ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值