在探索AI这条漫长的道路中,不管是在看书或者是看一些论文、参考文献中会经常出现一些名词,但是又不知道什么意思,本文把我在学习过程中遇到的最常见的一些单词按照首字母的英文顺序列出来,防止下次忘记了可以查询:
A:
B:
- batch-size: 1次迭代所使用的样本量。
- Bounding Box(bbox):
C:
-
Cross-modal(跨模态):跨模态算是多模态的子集,而模态是指数据的存在形式,比如文本、音频、图像、视频等文件格式。有些数据的存在形式不同,但都是描述同一事物或事件的。而我们在信息检索的需求往往不只是同一事件单一模态的数据, 也可能需要其他模态的数据来丰富我们对同一事物或事件的认知,此时就需要跨模态检索来实现不同模态数据之间的检索。不同模态之间的数据差别是很大的, 比如给你一张比基尼美女的图片,再配以对比基尼美女的文字描述,再来一张比基尼美女的素描,甚至再来一段声音。这些模态之间想建立联系是较为复杂的, 如何实现跨模态的相互认识,我们需要把这些模态整理一下,简单的说就是让它们尽量一致。
-
convolution kernel(卷积核):图像处理时,给定输入图像,在输出图像中每一个像素是输入图像中一个小区域中像素的加权平均,其中权值由一个函数定义&