Nifi用户文档分析(1)
Nifi文档分析。
术语介绍
DataFlow Manager(DFM):NiFi用户,有添删改数据流组件权限。
FlowFile:代表NiFi中的单个数据。由两个组件组成:属性和内容,内容是FlowFIle表示的数据,属性是提供有关数据的信息或上下文的特征,两者由键值对构成。所有FlowFile都具有的标准属性:
-uuid:通用唯一标识符,用于区分.
-filename:数据存磁盘或外部服务时可使用的可读文件名
-path:分层结构值
处理器:监听传入、提取外部、发布数据、转换提取
关系:定义给处理器,用于指示处理FlowFile的结果
连接:由关系组成,连接组件创建数据流;FlowFile传输到特定关系时,会被添加到相关连接的队列中
控制器服务:扩展点,由DFM添加和配置,在NiFi启动时启动,提供其他组件使用的信息
报告任务:后台运行,提供实例中发生情况的统计报告
漏斗:将多个连接的数据合并到一个连接中
进程组:数据流复杂时,在更高更抽象层面上推断数据流。允许将多个组件组合到一个进程组中。NiFi用户界面使用DFM轻松地将多个流程组连接到逻辑数据流中,并允许DFM进入流程组以查看和操作流程组中的组件。
端口:一个或多个进程组构建的数据流使用端口将进程组连接到其他数据流组件。
远程进程组:不同NiFi实例中传输数据流。
公告:应用程序当前状态的监视和反馈。
模板:数据流通常是由许多可以重用的子流组成。NiFi允许DFM选择数据流的一部分并创建模板,可以拖动到画布。
flow.xml.gz:DFM放入NiFi用户界面画布的所有内容实时写入;更新时会自动创建备份,可以使用备份文档来回滚流配置。
NiFi用户界面
- Components Toolbar:左上角是组件工具栏,包含可以拖动到画布上以构建数据流的组件。
- Status Bar:状态栏位于组件工具栏下,提供有关当前在流中处于活动状态的线程数,数据量,远程进程组数,信息画布上的处理器存在于每个状态,每个状态下画布上存在多少版本化的进程组和上次刷新这些信息的时间戳;集群中有多少节点以及当前连接的节点数。
- Operate Plalette:操作面板位于屏幕的左侧。由DFM用于管理流的按钮+管理用户访问和配置系统属性的管理员组成。
- Global Menu+Search:画布右侧是全局菜单和搜索,可以使用“搜索”轻松查找画布上的组件,并按组件名称,类型,标识符,配置属性及其值进行搜索
- 此外,UI还具有一些功能,可让您轻松浏览画布。您可以使用“导航选项板”在画布上平移,以及放大和缩小。数据流的“鸟眼视图”提供了数据流的高级视图,并允许您平移大部分数据流。您还可以在屏幕底部找到面包屑。当您导航进出流程组时,面包屑会显示流程中的深度,以及您输入的每个流程组以达到此深度。面包屑中列出的每个进程组都是一个链接,可以将您带回流中的该级别。
多租户授权访问UI
多租户授权允许多组用户(租户)命令,控制和观察数据流的不同部分,具有不同级别的授权。当经过身份验证的用户尝试查看或修改NiFi资源时,系统会检查用户是否具有执行该操作的权限。这些权限由可以应用于系统范围或单个组件的策略定义。从数据流管理器的角度来看,这意味着一旦您有权访问NiFi画布,您就可以看到一系列功能,具体取决于分配给您的权限。
构建DataFlow
DFM能够使用NiFi UI构建自动数据流。只需将组件从工具栏拖到画布,配置组件以满足特定需求,并将组件连接在一起。
向画布中添加组件
本节将查看该工具栏中的每个组件:
处理器是最常用的组件,因为它负责数据的入口,出口,路由和操作。将处理器拖动到画布上时,会向用户显示一个对话框,以选择要使用的处理器类型:
在右上角,用户可以根据处理器类型或与处理器关联的标签过滤列表。处理器开发人员能够将标签添加到其处理器中。这些标签在此对话框中用于过滤,并显示在标签云的左侧。使用特定标记存在的处理器越多,标记在标记云中显示的越大。单击云中的标记会将可用的处理器过滤为仅包含该标记的处理器。如果选择了多个标记,则仅显示包含所有这些标记的处理器。例如,如果我们只想显示那些允许我们提取文件的处理器,我们可以同时选择filesTag和ingestTag:
受限制的组件将在受限 其名称旁边标有 图标。这些组件可用于执行操作员通过NiFi REST API / UI提供的任意未经过抽样的代码,或者可用于使用NiFi OS凭据获取或更改NiFi主机系统上的数据。这些组件可以由其他授权的NiFi用户使用,超出应用程序的预期用途,升级权限,或者可以公开有关NiFi进程或主机系统内部的数据。所有这些功能都应被视为特权,管理员应了解这些功能,并为可信用户的子集明确启用它们。在允许用户创建和修改受限制的组件之前,必须授予他们访问权限。徘徊在受限 图标将显示受限组件所需的特定权限。无论限制如何,都可以分配权限。在这种情况下,用户可以访问所有受限制的组件。或者,可以为用户分配对特定限制的访问权限。如果用户已被授予对组件所需的所有限制的访问权限,则他们将具有对该组件的访问权限,否则将获得足够的权限。
单击Add按钮或双击处理器类型将选定的处理器添加到画布中删除它的位置。
【注】:对于添加到画布的任何组件,可以使用鼠标选择它并将其移动到画布上的任何位置。此外,可以通过按住Shift键并选择每个项目或按住Shift键并在所需组件周围拖动选择框,一次选择多个项目。
将处理器拖到画布上后,可以通过右键单击处理器并从上下文菜单中选择一个选项来与其进行交互。根据分配给您的权限,上下文菜单中可用的选项会有所不同。
配置:此选项允许用户建立或更改处理器的配置(请参阅配置处理器)。
【注】:对于处理器,端口,远程进程组,连接和标签,可以通过双击所需组件来打开配置对话框。
启动或停止:此选项允许用户启动或停止处理器; 该选项可以是Start或Stop,具体取决于处理器的当前状态。
启用或禁用:此选项允许用户启用或禁用处理器; 该选项将为“启用”或“禁用”,具体取决于处理器的当前状态。
查看数据来源:此选项显示NiFi数据来源表,其中包含有关通过该处理器路由的FlowFiles的数据出处事件的信息(请参阅数据源)。
查看状态历史记录:此选项打开处理器统计信息随时间的图形表示。
查看用法:此选项将用户带到处理器的使用文档。
查看连接→上游:此选项允许用户查看和“跳转”到进入处理器的上游连接。当处理器连接进出其他进程组时,这尤其有用。
查看连接→下游:此选项允许用户查看和“跳转”到处理器外的下游连接。当处理器连接进出其他进程组时,这尤其有用。
视图中心:此选项将画布的视图置于给定的处理器上。
更改颜色:此选项允许用户更改处理器的颜色,这可以使大流量的可视化管理更容易。
创建模板:此选项允许用户从所选处理器创建模板。
复制:此选项将所选处理器的副本放在剪贴板上,以便可以通过右键单击画布并选择“粘贴”将其粘贴到画布上的其他位置。复制/粘贴操作也可以使用按键Ctrl-C(Command-C)和Ctrl-V(Command-V)完成。
删除:此选项允许DFM从画布中删除处理器。
输入端口:输入端口提供将数据传输到进程组的机制。进程组中的所有端口必须具有唯一的名称。
输出端口:输出端口提供了一种机制,用于将数据从进程组传输到进程组外部的目标。进程组中的所有端口必须具有唯一的名称。
进程组:进程组可用于对一组组件进行逻辑分组,以便更容易理解和维护数据流。
将进程组拖到画布上后,可以通过右键单击进程组并从上下文菜单中选择一个选项来与其进行交互。
虽然上下文菜单中提供的选项各不相同,但如果您具有使用进程组的完全权限,则通常可以使用以下选项:
配置:此选项允许用户建立或更改进程组的配置。
变量:此选项允许用户在NiFi UI中创建或配置变量。
输入组:此选项允许用户进入进程组。
也可以双击进程组输入它。
开始:此选项允许用户启动进程组。
停止:此选项允许用户停止进程组。
查看状态历史记录:此选项打开过程组随时间变化的统计信息的图形表示。
查看连接→上游:此选项允许用户查看和“跳转”进入进程组的上游连接。
查看连接→下游:此选项允许用户查看和“跳转”到流程组外的下游连接。
视图中心:此选项将画布视图置于给定进程组的中心。
组:此选项允许用户创建一个新的流程组,其中包含选定的流程组和在画布上选择的任何其他组件。
创建模板:此选项允许用户从选定的进程组创建模板。
复制:此选项将所选进程组的副本放在剪贴板上,以便可以通过右键单击画布并选择“粘贴”将其粘贴到画布上的其他位置。复制/粘贴操作也可以使用按键Ctrl-C(Command-C)和Ctrl-V(Command-V)完成。
删除:此选项允许DFM删除进程组。
漏斗:漏斗用于将来自多个Connections的数据合并到一个Connection中。有两个好处:1.通过将这些Connections汇集到一个Connection中,可以绘制该单个Connection以跨越该大空间;2.可以使用FlowFile优先级配置器配置Connections。
模板:模板可以由流的各个部分的DFM创建,也可以从其他数据流导入。这些模板提供了更大的构建块,可以快速创建复杂的流程。
单击下拉框可显示所有可用模板。
标签:标签用于为数据流的各个部分提供文档。