计算机中的向量,embedding

向量在编程中常用于数据存储,特别是在比较和分析数据差异时。例如,通过计算文章A和B的相似度,涉及字数差异、共同单词数量等多维度信息,这些信息构成了向量。向量的维数指元素个数。在神经网络中,分布式表示(Distributed Representation)和word embedding通过减少连接线权重和提高训练效率,体现了向量的重要作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

向量(Vector),计算机编程语言用语,在如VB、C、C++、Pascal、Python或者其他编程语言中的向量,就是一个存放数据的地方,类似于一维数组和链表。
至于向量,通常会被用在比较两个数据的差异上
举个例子,我想知道“文章 A 和文章 B 的相似度”:
那么我可能会收集这些信息:
文章 A 和 B 的字数差异
文章 A 和 B 中相同的单词及其数量
文章 A 和 B 中完全相同的句子及其数量
这些信息是“不同维度上的值”,其实也就是向量了。
在实际应用中,我很可能会再设计一种算法,来”比较 A 和 B 的相似度与 A 和 C 的相似度哪个更高“,
这其实就是在定义一种向量减法。
向量的维数指的向量分量的个数。用大白话来讲就是描述一个向量需要用到好几个元素,有几个元素这个向量就有几维。比如最直观的三维向量,分别用x、y、z描述,所以这个向量就是三维的。





计算机中的向量,embedding





计算机中的向量,embedding





神经网络分析
假设我们的词汇只有4个,girl, woman, boy, man,下面就思考用两种不同的表达方式会有什么区别。
尽管我们知道他们彼此的关系,但是计算机并不知道。在神经网络的输入层中,每个单词都会被看作一个节点。 而我们知道训练神经网络就是要学习每个连接线的权重。如果只看第一层

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值