Google Cloud数据存储与管理全解析
1. 从GA4导出创建分区BigQuery表
GA4默认导出的是“分片”表,即每个表单独创建,可使用SQL通配符来查询所有表。例如,三天的表分别为 events_20210101 、 events_20210102 和 events_20210103 ,可以通过 SELECT * FROM dataset.events_* 查询,其中 * 是通配符。
若要优化下游查询,将这些表聚合为一个分区表会使工作流程更顺畅,并实现查询速度的优化。可以使用Pub/Sub主题触发一个作业,将表复制到分区表中。具体操作步骤如下:
1. 前往Pub/Sub主题,点击顶部按钮创建一个由其触发的Cloud Function。
2. 使用以下Python代码将GA4 BigQuery导出复制到分区表:
import logging
import base64
import JSON
from google.cloud import bigquery # pip google-cloud-bigquery==1.5.1
import re
# replace with your dataset
DEST_DATASET = 'REPLACE_DATASET'
def make_partition_tbl_name(table_id):
t_split = table_id.split('_20')
name = t_
超级会员免费看
订阅专栏 解锁全文
45

被折叠的 条评论
为什么被折叠?



