机器学习项目(二) 人工智能辅助信息抽取(十)

本文介绍了预训练模型在图像和NLP领域的应用,包括ImageNet、ILSVRC、AlexNet在图像领域的贡献,以及ELMO、GPT和BERT在NLP领域的创新。预训练模型能提升训练效率,解决一词多义问题,并在多种任务中展现强大表征能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

预训练模型

1.图像领域预训练模型

ImageNet

2009年由李飞飞团队邓家等人提出,并迅速发展成为CV领域最知名的比赛ILSVRC,从2010年举办第一届,到2017年李飞飞宣布最后一届,前后总共举办8年,这八年间先后在这个比赛中涌现了一大批推动AI领域尤其是CV领域发展的算法和模型

ILSVRC

2012年Hinton团队提出了AlexNet,超过当时第二名效果41%,一下子引爆了AI领域,因此2012年也被成为"深度学习元年"

图像中的预训练

模型的较低层学习到的主要是物体的边缘,往高层后逐步就变成了成型的物体了。一般来说,物体的边缘和纹路都是一些比较通用的视觉特征,因此将这一部分对应的模型参数用来初始化task-specific模型中的参数,意味着模型就不要再从头开始学习这些特征,从而大大提升了训练的效率和性能。

预训练在图像的应用

1.训练数据少,不足以训练复杂网络
2.加快训练速度
3.参数初始化,找到好的初始点,有利于优化

2.NLP领域预训练模型

类似于图像领域中的ImageNet上预训练的各种模型,来做一个NLP中预训练好的Encoder模块,拿来直接利用。需要思考如何设计一些更通用的可以迁移利用的东西。
在这里插入图片描述

固定词向量的缺陷
1.一词多义,上下文相关
2.未登录词处理,新词发现

ELMO

根据当前上下文对Word Embedding 动态

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值