嵌入空间中的迁移学习:挑战与机遇
1. 机器学习的现状与挑战
随着数据驱动产业、高性能计算技术、物联网和众包平台的兴起,机器学习(ML)算法和技术在计算机视觉、自然语言处理、机器人技术、复杂网络科学和决策等众多领域得到了广泛应用。一些当前的ML算法已经达到了人类水平的性能,并在实际中得到了广泛应用,对经济产生了显著影响。例如,在消费市场,商业个人助理机器人、无人机配送服务和自动驾驶汽车等都在逐渐普及;在股票市场,十大市值最高的公司中有九家都在大力投资和使用ML技术。
然而,当前的ML算法仍然存在一些不足之处。一方面,最先进的ML算法依赖大量高质量的数据集来训练模型,但生成这样的数据集是具有挑战性的。虽然众包平台的出现解决了一些常见应用的数据标注问题,但对于许多特定应用来说,生成高质量的标注数据集仍然是耗时且可能不可行的。另一方面,即使使用高质量的标注训练数据集学习到了模型,数据分布也可能随时间发生变化,导致模型泛化能力下降,需要不断重新训练模型。此外,随着深度学习模型变得越来越复杂,训练这些模型需要大量的计算资源,而持续的模型训练在当前的计算能力下是不可行的。
2. 迁移学习的兴起
与当前的ML方法相比,人类能够更高效地学习。人类可以从少量示例中学习任务,将知识推广到未经历过的条件,并不断适应和更新技能以执行各种任务。这是因为人类能够有效地利用过去的经验知识,识别不同学习问题之间的相似性,并通过集体和协作学习来共享专业知识。
受人类这些能力的启发,并且由于单任务ML技术的性能已接近理论学习上限,ML研究已从孤立地学习单个任务转向研究如何在相关的不同领域、任务和代理之间转移知识,这一研究领域被称为迁移学习。迁移学习的目标是通过克服标注数据
超级会员免费看
订阅专栏 解锁全文
434

被折叠的 条评论
为什么被折叠?



