Decision Tree
A tree-like graph or model of decisions and their possible consequences.
Threaded Binary Tree
如果right child是null pointer就指向inorder successor
如果left child是null pointer就指向inorder predecessor
可以线形的遍历二叉树,比递归的中序遍历快
Information Entropy

应用举例,假设26个字母出现次数相同,则每个字母的概率1/26,单个字母的信息熵-log(1/26)由此算出的信息熵为4.7,代表此字母包含的信息量
汉字假设2500个,每个出现概率相同,-log(1/2500),由此算出的信息熵为11.3,说明单个汉字包含信息比字母多
说明同样内容的信息,汉字写的更短,书页数更少
本文深入探讨了决策树模型及其线性遍历的效率优势,并通过信息熵概念解释了字母与汉字在信息量上的差异,强调了在数据科学中决策树与信息熵的应用价值。
254

被折叠的 条评论
为什么被折叠?



