向量(Vector),计算机编程语言用语,在如VB、C、C++、Pascal、Python或者其他编程语言中的向量,就是一个存放数据的地方,类似于一维数组和链表。
至于向量,通常会被用在比较两个数据的差异上
举个例子,我想知道“文章 A 和文章 B 的相似度”:
那么我可能会收集这些信息:
文章 A 和 B 的字数差异
文章 A 和 B 中相同的单词及其数量
文章 A 和 B 中完全相同的句子及其数量
这些信息是“不同维度上的值”,其实也就是向量了。
在实际应用中,我很可能会再设计一种算法,来”比较 A 和 B 的相似度与 A 和 C 的相似度哪个更高“,
这其实就是在定义一种向量减法。
向量的维数指的向量分量的个数。用大白话来讲就是描述一个向量需要用到好几个元素,有几个元素这个向量就有几维。比如最直观的三维向量,分别用x、y、z描述,所以这个向量就是三维的。
神经网络分析
假设我们的词汇只有4个,girl, woman, boy, man,下面就思考用两种不同的表达方式会有什么区别。
尽管我们知道他们彼此的关系,但是计算机并不知道。在神经网络的输入层中,每个单词都会被看作一个节点。 而我们知道训练神经网络就是要学习每个连接线的权重。如果只看第一层