数据访问、安全与平台业务价值实现
1. 数据访问与工具选择
1.1 BI 工具与 BigQuery 适配
近年来,商业智能(BI)领域发生了变化,像 Tableau 这样的主要参与者如今已全面支持 BigQuery。但如果你的组织使用的是小众 BI 解决方案,并且计划采用 Google Cloud 作为数据平台,要确保你的报告解决方案能与 BigQuery 无缝协作。
1.2 直接连接数据湖的问题
很多人会问能否将 BI 工具直接连接到数据平台的数据湖层。虽然技术上可行,但这并非推荐方案。如今许多现代 BI 和报告工具支持 Apache Spark 及其 SQL API,理论上 BI 工具可直接从数据湖查询数据并提供可视化和数据探索功能。然而,用户期望 BI 工具具备交互性和响应性,等待 Spark SQL 查询完成需要数十秒甚至数分钟,这会让数据分析或业务用户感到沮丧。相比之下,云数据仓库更适合提供这种交互式体验,因此建议将数据仓库作为数据平台设计的标准组件。
1.3 使用 Excel 作为 BI 工具
Excel 是全球最受欢迎的数据处理和分析工具之一,许多业务用户能熟练使用它构建复杂的分析和可视化。实际上,Excel 支持 JDBC/ODBC 连接器,可连接任何云数据仓库,在 Google Cloud 上,Google Sheets 也能无缝连接 BigQuery。
不过,使用 Excel 作为针对数据仓库的分析工具时,需考虑以下问题:
- 性能方面 :运行在用户计算机上的 Excel 只能处理一小部分数据,而运行在专用服务器上的 BI