消失理想遗传编程(VIGP):解决遗传编程膨胀问题的新方法
1. 引言
在数据科学和机器学习领域,遗传编程(Genetic Programming,GP)是一种强大的工具,可用于符号回归等任务。然而,GP存在一个显著的问题——膨胀(bloat),即搜索过程中候选函数变得过于复杂,这在许多应用中是不可取的。本文将介绍一种名为消失理想遗传编程(Vanishing Ideal GP,VIGP)的新方法,它能够有效解决GP的膨胀问题,并在符号回归任务中取得良好的效果。
2. 遗传编程与符号回归
遗传编程为符号回归提供了一种强大的方法,因为它不需要固定函数模型。在搜索过程中,以树形式表示的函数会随机生成、交配和变异。然而,GP存在正膨胀现象,即树在搜索过程中迅速变得复杂,导致搜索效率低下,解决方案过于复杂。
这种膨胀现象的一个原因是,GP中树的适应度基于其对数据点的均方误差,即适应度仅取决于函数对数据点的行为。因此,只要简单函数和复杂函数在数据点上取值相同,GP就会将它们视为相同的函数。
3. 消失理想遗传编程(VIGP)的核心思想
VIGP的核心思想是利用对数据点等效于零的函数(消失函数),将复杂函数简化为简单函数。虽然找到最有效地减少复杂函数的消失函数是一个难题,但当函数限制为多项式时,可以通过有限集的消失多项式(消失理想的基)来描述数据点的消失多项式集合。
假设我们有N个n维数据点的列表X = {x1, …, xN}和每个点的目标值列表T = {t1, …, tN},我们的目标是找到一个n元多项式f,满足ti = f(xi),∀i ∈ {1, …, N}。对于满足该条件的函数f,若存在一个在数据点
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



