使用 python 统计 ODPS 空间内的表和数据情况。
创建统计表
CREATE TABLE `table_statistics` (
`table_name` string COMMENT '表名',
`partition_name` string COMMENT '最新分区',
`chinese_name` string COMMENT '中文表名',
`column_count` bigint COMMENT '字段数量',
`column_comment_null_count` bigint COMMENT '字段注释缺失数量',
`pt_count` bigint COMMENT '分区数量',
`data_count` bigint COMMENT '最新分区数据量'
)
COMMENT '数据情况统计'
PARTITIONED BY (dt string)
LIFECYCLE 180;

本文介绍如何使用Python结合PyODPS库来统计阿里云ODPS空间内的表和数据情况,包括表的基本信息、字段数量、字段注释缺失情况、分区数量及最新分区的数据量等。
最低0.47元/天 解锁文章
3851

被折叠的 条评论
为什么被折叠?



