12、Google Cloud数据存储与管理全解析

Google Cloud数据存储与管理全解析

1. 从GA4导出创建分区BigQuery表

GA4默认导出的是“分片”表,即每个表单独创建,可使用SQL通配符来查询所有表。例如,三天的表分别为 events_20210101 events_20210102 events_20210103 ,可以通过 SELECT * FROM dataset.events_* 查询,其中 * 是通配符。

若要优化下游查询,将这些表聚合为一个分区表会使工作流程更顺畅,并实现查询速度的优化。可以使用Pub/Sub主题触发一个作业,将表复制到分区表中。具体操作步骤如下:
1. 前往Pub/Sub主题,点击顶部按钮创建一个由其触发的Cloud Function。
2. 使用以下Python代码将GA4 BigQuery导出复制到分区表:

import logging
import base64
import JSON
from google.cloud import bigquery # pip google-cloud-bigquery==1.5.1
import re
# replace with your dataset
DEST_DATASET = 'REPLACE_DATASET'

def make_partition_tbl_name(table_id):
    t_split = table_id.split('_20')
    name = t_
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值