Hub 是 Jina 全家桶中非常重要的一个成员,本期推文我们将详细介绍 Hub 的相关内容。
在过往推文中,我们介绍过:
* 为文本和图像创建 SOTA 表征向量的 CLIP-as-service
今天,我们将为大家介绍 Jina 全家桶中,另一个重要成员--Jina Hub。
Hub:A Marketplace for Executors
我们知道,Document、Executor 和 Flow 是 Jina 中的三个重要概念。

Document:封装非结构化数据
Executor:实现神经搜索系统所需要的不同模块
Flow:将 Executor 连接起来
Document 是 Jina 中一个基础的数据类型,可以帮助开发者方便地描述非结构化数据,相当于 Numpy 中的 ndarray 或 PyTorch 中的 Tensor。
一组 Document 构成一个 DocumentArray,开发者可以像使用 Python 原生的 list 一样使用 DocumentArray。
Executor 对应神经搜索系统中的不同模块,实现对数据处理的核心功能。
Flow 则对应整套神经搜索系统,将多个 Executor 连接起来,构建成一套完整的搜索系统。
在 Flow 中调用 Executor 十分简单:

Jina Hub是Jina项目中的Executor分享平台,提供多种预训练Executor,如CLIPTextEncoder、CLIPImageEncoder和HNSWPostgreSQLIndexer,简化神经搜索系统构建。用户可以创建、发布Executor,并在本地或远程使用。Jina Hub通过降低创建搜索系统的复杂度,促进开发者间的协作和资源共享。
最低0.47元/天 解锁文章
2351

被折叠的 条评论
为什么被折叠?



