1、概念提出:
在国际学习表征会议-ICLR2017,深度学习顶会:
2、GCN做什么:
DL的经典模型CNN、RNN在CV和NLP领域都取得了优秀的结果,但是两者在图结构的数据中处理并不理想。
CNN:做图像识别,图像是一个二维的结构,CNN使用Kernel和Stride在图片上平移,通过卷积的方式来提取特征。关键在于图片结构的平移不变性,一个kernel小窗口无论移动到图片的哪个位置,它的内部结构都是一样的,所以CNN可以实现参数共享。
RNN:处理对象是自然语言这种序列信息,它是一种一维结构,RNN通过各种门的操作,使序列前后的信息互相影响,从而捕获序列的特征。
所以,CNN和RNN处理的图片和语言数据都是欧式空间的数据,所以才有维度的概念,其特点就是数据结构很规则,但是在现实生活中,还是以不规则的数据为主,典型的是图结构,又称栝拓扑结构,比如:
1、社交网络
2、化学分子结构
3、知识图谱等
对于图片和语言:
图片:做目标检测识别时,我们关注的是图片上的需要识别的关键点,把这些点连接组成也是一种图
语言:语言内部也有着复杂的树结构,也是图结构
3、图结构数据特点:
1、数据不规则,无限维度
2、不存在平移不变性,CNN、RNN瞬间无效
所以,GCN的发明和提出,是为了处理图结构这种数据的
(