Hub 是 Jina 全家桶中非常重要的一个成员,本期推文我们将详细介绍 Hub 的相关内容。
在过往推文中,我们介绍过:
* 为文本和图像创建 SOTA 表征向量的 CLIP-as-service
今天,我们将为大家介绍 Jina 全家桶中,另一个重要成员--Jina Hub。
Hub:A Marketplace for Executors
我们知道,Document、Executor 和 Flow 是 Jina 中的三个重要概念。
Document:封装非结构化数据
Executor:实现神经搜索系统所需要的不同模块
Flow:将 Executor 连接起来
Document 是 Jina 中一个基础的数据类型,可以帮助开发者方便地描述非结构化数据,相当于 Numpy 中的 ndarray 或 PyTorch 中的 Tensor。
一组 Document 构成一个 DocumentArray,开发者可以像使用 Python 原生的 list 一样使用 DocumentArray。
Executor 对应神经搜索系统中的不同模块,实现对数据处理的核心功能。
Flow 则对应整套神经搜索系统,将多个 Executor 连接起来,构建成一套完整的搜索系统。
在 Flow 中调用 Executor 十分简单: