
大数据
taste_cyn
这个作者很懒,什么都没留下…
展开
-
parquet学习
读 1. spark read parquet file parquetFile = spark.read.parquet('traj_pred_bc_train_data_sampled/dt=2021-09-30/city_id=88/') parquetFile.count() parquetFile.take(2) 2. pyarrow.parquet read parquet file import pyarrow.parquet as pq pfile = pq.read_table(file原创 2022-03-28 17:54:17 · 2168 阅读 · 0 评论 -
hive/spark-SQL常用积累
原创 2021-02-26 14:04:42 · 169 阅读 · 0 评论