
ELT
文章平均质量分 53
Redash中文社区
现代数据栈MDS中文社区
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
配置Airbyte资源限制
如果您连接(管道)的url是。如果 job 容器的内存不足,只需登录到 Airbyte Web 中的 job 页面,检查日志查看 job 的资源配置是否符合预期,如果确实给的资源不足,可以根据上面的步骤修改资源限制配置。连接到 Airbyte 工作数据库并且执行以下 query(注意需要将 id-from-step-1 替换您上一步获取的连接(管道)id,并将资源限制修改给您想要限制的值)替换 id-from-step-1 为上一步查询中获取到id,然后替换资源限制的值为想要限制的值,然后执行query。原创 2023-03-03 15:19:22 · 600 阅读 · 0 评论 -
配置 AIRBYTE 工作数据库
此外,使用云托管的Postgres实例(如AWS的RDS,GCP的Cloud SQL),您将得到更细粒度的备份和实例大小调整。#外部数据库的用户名 DATABASE_USER=postgres #外部数据库的密码 DATABASE_PASSWORD=password #外部数据库的 ip 或者域名 DATABASE_HOST=host.docker.internal #外部数据库的端口 DATABASE_PORT=3000 #外部数据库的 db 名称 DATABASE_DB=postgres。原创 2023-03-02 13:06:50 · 704 阅读 · 0 评论 -
Docker部署Airbyte
Docker环境下安装Airbyte。原创 2023-02-28 12:49:13 · 939 阅读 · 0 评论 -
Airbyte API
Destination_definition:目标定义,实现了目标的增删改查功能。Source_definition:来源定义,实现了来源的增删改查功能。Workspace:工作区管理,实现了工作区的创建、删除等功能。Connection:管道管理,实现了管道的创建、删除等功能。Destination:目标管理,实现了来源连接建立等功能。Source:来源管理,实现了来源连接建立等功能。Oauth:权限管理,实现来源目标的授权管理。State:状态管理,获取和更新管道运行状态。Logs:日志管理。原创 2023-02-27 13:19:45 · 476 阅读 · 0 评论 -
Airbyte的同步复制模式
ELT 哲学的核心原则,即数据在提取和加载阶段移动时应保持不变,以便始终可以在目标中访问原始数据。由于目标中存在数据的未修改版本,因此将来可以重新转换该版本,而无需从源系统重新同步数据。原创 2023-02-24 13:49:23 · 474 阅读 · 0 评论 -
Airbyte架构
Airbyte应用架构原创 2023-02-23 13:54:01 · 555 阅读 · 0 评论 -
Airbyte入门
使用专用实例将为您的 Airbyte 部署提供更高的可靠性。此外,使用云托管的 Postgres 实例(例如 AWS RDS 我们的 GCP 云 SQL),您将受益于自动备份和细粒度大小调整。您可以从一个非常小的实例开始,但根据您的 Airbyte 使用情况,如果不截断作业历史记录,作业数据库可能会增长并需要更多存储空间。系统将要求您输入用户名和密码,默认用户名和密码是 airbyte 和password,部署到服务器后,请注意,源(或目标)连接器中的实际数据永远不会传输或保留在此内部数据库中。原创 2023-02-22 16:19:54 · 566 阅读 · 0 评论 -
Airbyte支持的数据源类型
Airbyte能支持的常用软件非常多:如抖音、Wordpress、Salesforce、Metabase、Netsuite、Peoplesoft、SAP Business One、Shopify、Zoom、Docker hub、Github、GitLab、Jira、MeiliSearch等等。Airbyte支持的数据类型丰富,全部类型详见官网。与其它软件API集成。原创 2023-02-21 15:46:51 · 301 阅读 · 0 评论