ID3（Iterative Dichotomiser 3）算法原理简述

最新推荐文章于 2024-08-31 22:14:32 发布

原创

最新推荐文章于 2024-08-31 22:14:32 发布 · 1.1k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#ID3 #Iterative Dichotomiser 3 #机器学习 #决策树

本文介绍了ID3算法的基本原理，包括信息熵的概念及其在衡量系统无序程度中的作用，以及信息增益的计算方法，用于评估特征在分类中的重要性。ID3算法基于信息增益选择最佳属性进行决策树划分，但存在对多值属性敏感、无法处理连续值和缺失值等问题，可能导致过拟合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.信息熵

熵( $E n t r o p y$ )这个概念最早起源于物理学，在物理学中是用来度量一个热力学系统的无序程度，而在信息学里面，熵是对不确定性的度量。在1948年，香农引入了信息熵，将其定义为离散随机事件出现的概率，一个系统越是有序，信息熵就越低，反之一个系统越是混乱，它的信息熵就越高。所以信息熵可以被认为是系统有序化程度的一个度量。

假设变量 $X$ 的随机取值为 $X$ ={ $x_1,x_2,x_3...,x_n$ },每一种取到的概率分别是 $P_x$ = { $p_1,p_2,p_3,...p_n$ },则变量 $X$ 的熵为: