人工智能、机器学习与深度学习的区别与联系_Forward no stop -优快云博客_机器学习与深度学习
人工智能简介(一)——深度AI科普调研团队_小白不白-优快云博客
AI综述专栏 | 朱松纯教授浅谈人工智能:现状、任务、构架与统一 (sohu.com):
人工智能是一个非常广泛的领域。当前人工智能涵盖很多大的学科,我把它们归纳为六个:
(1)计算机视觉(暂且把模式识别,图像处理等问题归入其中)、
(2)自然语言理解与交流(暂且把语音识别、合成归入其中,包括对话)、
(3)认知与推理(包含各种物理和社会常识)、
(4)机器人学(机械、控制、设计、运动规划、任务规划等)、
(5)博弈与伦理(多代理人agents的交互、对抗与合作,机器人与社会融合等议题)、
(6)机器学习(各种统计的建模、分析工具和计算的方法),
计算机视觉是一个domain, 它有很多问题要研究, 就像物理学。 而机器学习基本是一个方法和工具,就像数学和统计学。
机器学习框架概念:caffe,Pytorch,tensorflow,keras
tensorflow简介以及与Keras的关系、常用机器学习框架一览_德prince-优快云博客
计算机视觉方向综述:
计算机视觉入门系列(一) 综述_Computer Vision-优快云博客_计算机视觉综述
物体识别和检测(Object Detection)
语义分割(Semantic Segmentation)
运动和跟踪(Motion & Tracking)
三维重建(3D Reconstruction)
视觉问答(Visual Question & Answering)
动作识别(Action Recognition)
(1条消息) 详解计算机视觉五大技术:图像分类、对象检测、目标跟踪、语义分割和实例分割..._AI科技大本营-优快云博客
(1条消息) 2019计算机视觉方向调研_给时光以生命-优快云博客
backbone:
这个单词原意指的是人的脊梁骨,后来引申为支柱,核心的意思。在神经网络中,尤其是CV领域,一般先对图像进行特征提取(常见的有vggnet,resnet,谷歌的inception),这一部分是整个CV任务的根基,因为后续的下游任务都是基于提取出来的图像特征去做文章(比如分类,生成等等)。所以将这一部分网络结构称为backbone十分形象,仿佛是一个人站起来的支柱。
主干网络,用来做特征提取的网络,代表网络的一部分,一般是用于前端提取图片信息,生成特征图feature map,供后面的网络使用。通常用VGGNet还有你说的Resnet,因为这些backbone特征提取能力是很强,并且可以加载官方在大型数据集(Pascal 、Imagenet)上训练好的模型参数,然后接自己的网络,进行微调finetune即可。
(1条消息) 深度学习中的经典基础网络结构(backbone)总结_生命在于折腾!-优快云博客_深度学习backbone
SOTA全称是state of the art,是指在特定任务中目前表现最好的方法或模型。state-of-the-art/ state of the art,用来表述“当前最新的(方法)”
Benchmark和baseline都是指最基础的比较对象。你论文的motivation来自于想超越现有baseline/benchmark,你的实验数据都需要以baseline/benckmark为基准来判断是否有提高。唯一的区别就是baseline讲究一套方法,而benchmark更偏向于一个目前最高的指标,比如precision,recall等等可量化的指标。举个例子,NLP任务中BERT是目前的SOTA,你有idea可以超过BERT。那在论文中的实验部分你的方法需要比较的baseline就是BERT,而需要比较的benchmark就是BERT具体的各项指标。