向量数据库极简教程 | A Gentle Introduction to Vector Databases

这篇博客介绍了向量数据库的基本概念,解释了为何关系型数据库不足以处理非结构化数据,如图像、视频和文本。文章通过示例展示了如何使用Word2Vec生成嵌入向量,并探讨了向量数据库在搜索和推荐系统中的潜力。此外,还提到了向量数据库的选择和关键性能要求,如可扩展性、可靠性与速度。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

目录

Relational is not enough 关系是不够的

x2vec: A new way to understand datax2vec : 一种理解数据的新方法

Some prep work 一些准备工作

Example 0: Marlon Brando 示例 0:马龙·白兰度

Example 1: If all of the kings had their queens on the throne示例1:如果所有的国王都有他们的王后登上王位

Example 2: Apple, the company, the fruit, … or both?示例2:苹果,公司,水果,...还是两者兼而有之?

Prep work

Generating embeddings 生成嵌入

Normalize the resulting vector 规范化生成的向量

Now let’s compute distances 现在让我们计算距离

Searching across embedding vectors跨嵌入向量搜索

Putting it all together 将一切整合在一起

Selecting a vector database 选择矢量数据库

Some final words 最后几句话


In this blog post, I’ll introduce concepts related to the vector database, a new type of technology designed to store, manage, and search embedding vectors. Vector databases are being used in an increasingly large number of applications, including but not limited to image search, recommender system, text understanding, video summarization, drug discovery, stock market analysis, and much more.
在这篇博文中,我将介绍与向量数据库相关的概念,矢量数据库是一种旨在存储、管理和搜索嵌入向量的新型技术。矢量数据库正被用于越来越多的应用,包括但不限于图像搜索、推荐系统、文本理解、视频摘要、药物发现、股票市场分析等等。

图论入门 图论是一门研究图的性质和关系的数学分支。图是由节点和边组成的数据结构,节点表示对象,边表示对象之间的关系。图论可以用于解决许多实际问题,如社交网络分析、路线规划、电路设计等。 图可以分为有向图和无向图。有向图中的边有方向,表示从一个节点到另一个节点的单向关系;无向图中的边没有方向,表示两个节点之间的双向关系。 图还可以分为加权图和非加权图。加权图中的边有权值,表示两个节点之间的距离或代价;非加权图中的边没有权值,表示两个节点之间的关系仅仅是存在或不存在。 图的表示方法有邻接矩阵和邻接表。邻接矩阵是一个二维数组,其中每个元素表示两个节点之间的边;邻接表是一个链表数组,其中每个链表表示一个节点的邻居节点。 图的遍历方法有深度优先搜索和广度优先搜索。深度优先搜索从一个节点开始,沿着一条路径一直走到底,然后回溯到上一个节点继续搜索;广度优先搜索从一个节点开始,先访问它的所有邻居节点,然后再访问邻居节点的邻居节点,以此类推。 图的算法有最短路径算法和最小生成树算法。最短路径算法用于找到两个节点之间的最短路径,常用的算法有Dijkstra算法和Bellman-Ford算法;最小生成树算法用于找到一个无向图的最小生成树,常用的算法有Prim算法和Kruskal算法。 图论是计算机科学中的重要分支,它提供了许多解决实际问题的方法和工具。
评论 57
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI天才研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值