语义表示——神经网络与深度学习

原创

已于 2022-04-18 16:36:50 修改 · 4.6k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#神经网络 #深度学习

于 2022-04-18 16:35:16 首次发布

语义鸿沟是人工智能挑战，需要从底层特征抽取高层语义。好的表示应具备强表示能力、简化学习任务和普遍性。局部表示效率低下，分布式表示能发现数据间的语义相似性，是深度学习核心，尤其在自然语言处理中。神经网络学习分布式表示的能力推动了深度学习在多种问题上的应用，如图像字幕和机器翻译。

语义鸿沟是人工智能的挑战之一。

底层特征 VS 高层语义

人们对文本、图像的理解无法从字符串或者图像的底层特征直接获得。

底层特征和高层语义之间建立直接的映射十分困难。

例如对于一张简单的照片，我们拿到最底层的特征——图像的像素，比如一些红色、蓝色的像素，将这些底层特征和高层语义建立关系其实是非常难的，也就是说想建立一个直接的映射非常困难；例如一张情侣照片，人眼很容易根据图片的信息判断是情侣关系，但是从底层特征中是看不到的，特别是照片中含有很多噪声（不重要的背景信息），这对模型的预测会产生很多干扰，所以我们需要从底层的特征中抽取出蕴含高层语义的特征；例如对于文本信息，我们接收到的底层特征是一个个的字，但是组合到一起的，我们知道这是一首诗且表达思乡的情绪，这些通过表面的字符是没办法简单得到的。

所以我们需要从这些底层特征中构造出一些表示，这些表示蕴含高层的语义特征。

“好的表示”是一个非常主观的概念，没有一个明确的标准，但一般而言，好的表示具有以下几个优点：

1、应该具有很强的表示能力，同样的一个空间能表示更多的语义；

2、应该使后续的学习任务变得简单，用一个简单的模型就能完成任务，而不用涉及复杂分类器；

3、应该具有一般性，也就是说不能在这些数据上好，另外一些数据差。

数据表示是机器学习的核心问题。

表示形式：如何在计算机中表示语义？

局部表示 VS 分布式表示

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。