优化 Looker 环境:组织与管理指南
1. 探索 Looker 数据字典与应用
在 Looker 中,你可以探索和过滤字段以查看可用数据。点击“视图选项”,能在数据字典表中添加或隐藏列。点击某个字段(如 ID),右侧会打开“详情与注释”部分,可添加注释来分享该字段的更多信息,这些注释仅针对数据字典中的字段,不会保存到任何 LookML 描述中。
Looker 数据字典扩展提供了一个搜索 Looker 字段和描述的界面。你可以在 Looker 左侧导航菜单的“应用程序”部分找到 LookML 图表和 Looker 数据字典应用程序。若要删除或配置应用程序,点击“市场”图标 | “管理”。
操作步骤如下:
1. 探索和过滤字段查看数据。
2. 点击“视图选项”添加或隐藏列。
3. 点击字段添加注释。
4. 在“应用程序”部分找到相关应用。
5. 点击“市场”图标 | “管理”进行应用配置。
2. 组织 LookML 环境
LookML 项目由 LookML 开发人员/数据工程师管理,用于为自助式分析准备 Looker 探索。为使开发人员的工作更轻松高效,需对 LookML 项目进行良好组织。
2.1 准备工作
在左侧导航面板中,确保激活“开发模式”,然后转到“开发” | “项目” | “lb_thelook_ecommerce”(你可能为 LookML 项目使用了不同名称,找到你使用的项目)。
2.2 组织方法
- 使用文件夹 :LookML 项目中有基本的视图和模型文件夹,可通过点击文件浏览器中的“+” | “创建文件夹”或点击现有文件夹附近的三个点创建子文件夹来创建新文件夹,还可使用拖放方法移动文件夹。部分开发人员会用子文件夹组织视图,如“基础”视图子文件夹(基于原始表的主要视图)和“精炼”视图、派生表及修改后的基础视图子文件夹。
- 统一命名 :为 LookML 文件和元素使用一致且描述性的名称,准确反映其用途,如“siteA_customers.view”或“explore_orders_by_product.lkml”。
- 使用替换运算符 :利用替换运算符($)避免重复代码,使 LookML 更简洁易维护。
- 代码注释 :用清晰简洁的注释记录代码,解释复杂计算、数据源和依赖关系,方便后续参考。
- 版本控制 :使用 Git 或其他版本控制系统跟踪更改、恢复到先前版本并高效协作。遵循 Git 管理最佳实践,如保持提交小而专注于特定类型的更改、编写清晰简洁的提交消息、创建分支隔离更改以减少冲突、定期从主分支拉取更改以及通过 Git 发送代码进行审查。
- 建立风格指南 :为团队建立 LookML 风格指南,促进一致性并简化协作。
- 利用工具和脚本 :使用 LookML 工具和脚本来执行测试、检查和部署等任务,节省时间并减少人为错误。
3. 管理和监控 Looker
管理和监控 Looker 的使用对数据之旅很重要。Looker 界面的“管理”部分是管理组织无缝有效数据分析体验的指挥中心,包含通用、系统活动、用户、数据库、警报和计划、平台和认证等管理功能。部分管理功能可在 Google Cloud 项目中执行。
3.1 技术要求
要在 Looker 实例中执行管理任务,需在创建实例的 Google Cloud 项目中拥有 Looker 管理员(roles/looker.admin)IAM 角色。
3.2 配置主要设置
-
数据库部分
- 点击“管理”中的“数据库”下拉列表,选择“连接”。可编辑或测试现有数据库/数据仓库连接,点击“添加连接”添加新连接。选择 Looker 访问数据库的认证类型,如 OAuth、服务账户或应用程序默认凭证。若遇到连接错误或数据库有重大更改,建议在“连接”面板中测试和编辑连接设置。
- 选择“查询”,可找到一个表格,显示通过此 Looker 实例发送到数据库的最新 50 个请求的详细信息。点击每行的“详情”按钮,可查看查询的源、用户、连接等信息,部分查询的“SQL”选项卡中还包含 SQL 查询代码。
- 选择“持久派生表(PDTs)”,PDTs 是存储在数据库中的派生表,可按你控制的计划自动刷新。“管理”的“数据库”面板中的“持久派生表”页面可用于排查开发和生产中的 PDTs。过滤 PDTs 的方法有:点击“所有连接”选择要关注的数据库连接;使用右上角的搜索栏搜索感兴趣的 PDT;点击搜索栏附近的过滤图标过滤要检查的 PDT。
- 选择“数据组”,数据组用于为探索分配缓存策略和为 PDTs 指定持久化策略。若在 LookML 中已设置数据组,可在“数据库数据组”页面看到。点击数据组行的“操作”列中的齿轮图标,可重置缓存、触发数据组或转到 LookML 编辑器调试数据组。也可在 LookML 中使用“数据组”参数分配缓存策略或指定持久化策略。
下面是配置主要设置的 mermaid 流程图:
graph LR
A[进入管理界面] --> B[点击数据库下拉列表]
B --> C{选择连接}
C --> D[编辑或测试连接]
C --> E[添加新连接]
B --> F{选择查询}
F --> G[查看查询详情]
B --> H{选择持久派生表}
H --> I[过滤 PDTs]
B --> J{选择数据组}
J --> K[操作数据组]
-
通用面板
- 点击 Looker 菜单,然后点击“管理”,打开“通用”下拉列表,点击“本地化”。“本地化”中有两个参数:“区域设置”用于设置 Looker 界面语言,默认参数为“en”,也可在用户/用户组级别进行设置,用户或用户组设置会覆盖实例设置;“数字格式”有三种选项,可在用户级别修改。
- 模型本地化常与管理员本地化设置一起出现,可使模型的标签和描述适应用户的语言和习惯。配置 LookML 模型中的本地化,可查看相关页面。
- 点击“内部帮助资源”,点击“帮助”菜单中“启用内部帮助资源”旁边的切换按钮,修改“组织名称”和“在下方输入 Markdown”部分,以指导用户利用有用的内部资源。
- 转到“主页”,可设置整个组织的主页,可为标准主页或特定 Looker URL(如董事会页面的 URL),也可在“用户属性”部分为特定用户或组设置默认主页。
-
点击“设置”,可进行以下配置:
- 应用程序时区 :这是 Looker 应用的主要时区,计划的 Look 将使用此时间区,可更改并点击“更新”,也可在“设置”中启用用户特定的时区,然后在“管理” -> “用户”中更改时区。
- 默认私有个人文件夹 :可使个人用户文件夹对他人不可见(默认情况下并非如此),更改后点击“更新”保存。
- 新账户通知 :启用此功能可确保所有管理员在添加新用户并激活账户时收到通知,更改后点击“更新”保存。
- Cookie 通知横幅 :若在欧盟工作,可激活此功能。
- 默认可视化颜色 :可为 Looker 可视化选择调色板或创建新调色板(如使用公司颜色)。
- 数据策略 :可防止某些操作发生,如禁用“公共 URL”可防止公开分享 Look,启用“在 CSV 和 Excel 文件中阻止公式和宏”可转义导出文件中可被视为宏或公式的内容。
-
警报和计划面板
- 可设置警报并查看警报历史。Looker 中的警报可在数据出现可疑/异常事件时向收件人或收件人群组发送消息。警报在仪表板中配置,但在“管理”的“警报和计划”面板中,可在“警报”部分探索警报仪表板,在“警报历史”中查看运行、完成和失败的警报历史。
- 可查看“计划”中已安排的内容,并在“计划历史”中查看哪些成功、哪些失败。计划可定期向收件人或收件人群组发送 Look 或仪表板。在“管理”菜单的“警报和计划”部分的“计划”中,可看到 Looker 实例中的所有计划;在“计划历史”中,可查看运行、成功和失败的计划信息,以检查是否需要排查问题。
- 可在“计划电子邮件”中找到从 Looker 界面安排的电子邮件信息,该部分用于管理电子邮件数据策略(配置用户是否只能发送数据、仅发送链接或同时发送数据和链接),并查看外部收件人和电子邮件发件人。
操作步骤总结如下表:
| 面板 | 操作 | 步骤 |
| — | — | — |
| 数据库 | 连接 | 1. 点击“管理”中的“数据库”下拉列表,选择“连接”。2. 编辑或测试现有连接,添加新连接。3. 选择认证类型。 |
| 数据库 | 查询 | 1. 点击“数据库”下拉列表,选择“查询”。2. 查看查询详情。 |
| 数据库 | 持久派生表 | 1. 点击“数据库”下拉列表,选择“持久派生表”。2. 过滤 PDTs。 |
| 数据库 | 数据组 | 1. 点击“数据库”下拉列表,选择“数据组”。2. 操作数据组。 |
| 通用 | 本地化 | 1. 点击“通用”下拉列表,选择“本地化”。2. 设置区域和数字格式。 |
| 通用 | 内部帮助资源 | 1. 点击“内部帮助资源”。2. 修改相关信息。 |
| 通用 | 主页 | 1. 转到“主页”。2. 设置主页。 |
| 通用 | 设置 | 1. 点击“设置”。2. 进行各项配置。 |
| 警报和计划 | 警报 | 1. 设置警报。2. 查看警报历史。 |
| 警报和计划 | 计划 | 1. 查看计划内容。2. 查看计划历史。 |
| 警报和计划 | 计划电子邮件 | 查看电子邮件信息,管理数据策略。 |
4. 精细管理用户
在 Looker 中,管理谁能访问数据和分析工具对于维护安全和确保高效协作至关重要。目前,Looker(Google Cloud 核心)与 Google Cloud IAM 服务集成以进行用户认证和授权,之后还会有其他选项。添加用户后,Looker 管理页面的“用户”面板可通过角色和组进行精细控制。服务账户与用户账户不同,它用于应用程序连接 Looker API。Looker 还提供灵活的认证选项,包括支持 SAML、OpenID Connect 和其他第三方连接。
4.1 准备工作
在浏览器中打开两个标签页,一个是 Google Cloud 控制台(https://console.cloud.google.com/),另一个是 Looker 实例(可在 https://console.cloud.google.com/looker/instances 找到实例 URL)。
4.2 添加用户并分配角色
- 在 Google Cloud 控制台中,找到 IAM 和管理服务(可在搜索栏中搜索或点击左上角的菜单按钮查找)。
- 在 IAM 和管理服务的第一页(IAM)的“权限”选项卡中,点击“授予访问权限”。
- 在“新主体”中,添加要添加到 Looker 账户的人员的电子邮件地址,并选择 Looker 实例用户角色(其他可用选项包括 Looker 管理员、Looker 查看者和 Looker 服务代理)。
- 在 Looker 实例的“管理”的“认证”面板中,点击“Google”,选择新用户的默认角色(开发者可修改 LookML,用户或标准用户可使用探索功能,查看者只能查看内容元素),选择“用户”并点击“更新”。
- 复制 Looker 实例 URL(Google Cloud 控制台 -> Looker)并发送给获得访问权限的人员。此人首次连接后,其电子邮件将显示在 Looker 管理的“用户”面板中(“用户”页面的“添加服务账户”按钮可创建用于自动化和集成的特殊账户,而普通用户账户只能通过 Google Cloud IAM 添加)。
若提供访问权限的人员来自组织外部(具有不同的电子邮件域名),可能需要提供该域名的访问权限(若有电子邮件域名允许列表限制):转到 Google Cloud 控制台,找到 Looker,点击 Looker 实例的名称,然后点击“编辑”并修改“电子邮件域名允许列表”。该设置限制了 Looker 用户可以发送内容的电子邮件域名。
- 转到 Looker 管理的“用户”面板,检查添加的用户是否存在且角色为“用户”。
4.3 创建组和角色
- 转到“组”(管理 -> 用户 -> 组)并点击“添加组”。
- 将组命名为“营销”。
- 在“营销”组中,点击“添加成员”。
- 添加新的 Looker 用户到该组:搜索电子邮件,然后点击“添加成员”(可添加多个成员)。
- 转到“角色”。角色结合了权限(用户可以做什么)和数据访问(他们可以看到什么),基于模型集和权限集。
- 在“角色”中,点击“新建权限集”。
- 为新权限集命名(如“高级探索者”),并勾选以下复选框:access_data、see_looks、explore、create_table_calculations、create_custom_fields、can_create_forecast、save_content。然后滚动并点击“新建权限集”进行创建。
- 回到“角色”并点击“新建模型集”。
- 将其命名为“电子商务模型”,并勾选“lb_thelook_ecommerce”模型旁边的复选框。
- 点击“新建模型集”进行创建。
- 在“用户 -> 角色”中,点击“新建角色”。
- 将其命名为“营销电子商务探索者”,选择“高级探索者”作为权限集,“电子商务模型”作为模型集,“营销”作为组。
- 点击“新建角色”创建新角色并点击“确认”。
- 点击“取消”返回“角色”页面。
下面是创建组和角色的 mermaid 流程图:
graph LR
A[进入管理的用户面板] --> B[创建组]
B --> C[命名组为营销]
C --> D[添加成员]
A --> E[进入角色]
E --> F[新建权限集]
F --> G[命名权限集并勾选选项]
G --> H[创建权限集]
E --> I[新建模型集]
I --> J[命名模型集并勾选模型]
J --> K[创建模型集]
E --> L[新建角色]
L --> M[命名角色并选择权限集、模型集和组]
M --> N[创建角色并确认]
4.4 管理内容访问
- 转到“管理 -> 用户 -> 内容访问”。
- 选择要限制访问的内容(如“共享 -> 零售 -> 客户 A”)。
- 点击“管理访问权限”。
- 在弹出窗口中,选择“自定义用户列表”。
- 在“管理此文件夹的访问权限”的搜索栏中,找到新用户并为其分配“管理访问权限”、“编辑”角色。
- 点击“添加”,然后点击“保存”。
4.5 管理用户属性
用户属性是可在管理的“用户”面板中设置的额外用户参数,可在 LookML 中用于根据这些参数限制对某些维度或度量的访问。
1. 转到“管理 -> 用户”下拉列表,然后选择“用户属性”。
2. 点击“创建用户属性”。
3. 为其命名(如“部门”)。
4. 在“用户访问”中点击“无”,在“隐藏值”中点击“否”。
5. 点击“保存”。
6. 将出现两个选项卡:“组值”和“用户值”。
7. 在“组值”中,点击“+添加组”。
8. 选择之前创建的“营销”组,并添加“营销”作为值。
9. 点击“保存”。现在,“营销”组中的所有用户的“部门”用户属性将设置为“营销”。可以添加其他组并设置其属性。
10. 也可以在单个用户级别设置属性。点击“部门”用户属性的“用户值”选项卡,在下拉列表中选择管理员的电子邮件,然后点击“为用户设置值”。
11. 将值设置为“数据”并点击“保存”。
12. 在 LookML 项目中使用用户属性:转到菜单 -> 开发 -> 项目 -> LookML 项目。
13. 点击“lb_thelook_ecommerce”LookML 项目。
操作步骤总结如下表:
| 操作类型 | 步骤 |
| — | — |
| 添加用户并分配角色 | 1. 在 Google Cloud 控制台授予访问权限。2. 在 Looker 实例选择默认角色。3. 发送实例 URL。4. 检查用户和角色。 |
| 创建组和角色 | 1. 创建组并添加成员。2. 创建权限集和模型集。3. 创建角色并关联权限集、模型集和组。 |
| 管理内容访问 | 1. 选择内容。2. 管理访问权限。3. 选择用户并分配角色。4. 保存设置。 |
| 管理用户属性 | 1. 创建用户属性。2. 设置组值和用户值。3. 在 LookML 项目中使用。 |
通过以上对 Looker 环境的组织、管理和用户的精细控制,可以更好地利用 Looker 进行数据分析和协作,提高工作效率和数据安全性。
超级会员免费看
818

被折叠的 条评论
为什么被折叠?



