14、数据存储与建模全解析

数据存储与建模全解析

1. 数据存储与安全

数据存储是数据处理的基础环节,由于数据形式和用途多样,有多种系统可用于存储数据。在创建数据集时,可以配置表的过期时间。对于分区表,虽然表会一直存在,但希望分区随时间过期,以确保只保留最新数据。

1.1 分区表过期时间设置

可通过以下两种方式设置分区表的过期时间:
- gcloud 方式 :在本地 bash 控制台或云控制台中使用以下命令:

bq update --time_partitioning_field=event_date \
  --time_partitioning_expiration 604800 [PROJECT-ID]:[DATASET].partitioned_table
  • BigQuery DML 方式 :使用以下 SQL 语句:
ALTER TABLE `project-name`.dataset_name.table_name
SET OPTIONS (partition_expiration_days=7);

1.2 数据安全与隐私保护

除了设置被动的数据过期时间,还可以通过数据丢失预防 API(DLP API)主动扫描数据以防止隐私泄露。DLP API 能自动检测并屏蔽数据中的敏感信息,如电子邮件、电话号码和信用卡号码等。它可在云存储或 Bi

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值