BigQuery数据迁移与编程开发全解析
1. BigQuery数据加载与迁移
BigQuery支持多种语言的客户端库,并且具备流式API。下面是一个使用Python通过流式API加载数据的示例:
# create an array of tuples and insert as data becomes available
rows_to_insert = [
(u'U. Puerto Rico', 0.18,0.46,23000,1134,32000),
(u'Guam U.', 0.43,0.21,28000,1234,33000)
]
errors = client.insert_rows(table, rows_to_insert) # API request
当有新数据可用时,会调用BigQuery客户端的 insert_rows() 方法,该方法又会调用REST API的 tabledata.insertAll 方法。数据会被存储在BigQuery的流式缓冲区中,可立即进行查询,但可能需要长达90分钟才能用于导出。
对于将本地数据迁移到BigQuery,有以下几种方法:
- 网络条件好时 :
- 使用 bq load :如果网络与Google Cloud的互连速度快,可以使用 bq load 将数据加载到BigQuery。建议先将
超级会员免费看
订阅专栏 解锁全文
636

被折叠的 条评论
为什么被折叠?



