场景
之前我们通过k近邻算法和决策树做出了 分类,这是分类器会给出一个艰难的预测的最优的结果,我们可以根据这个结果做出决策,但是这个结果如果是错误的,就芭比扣了。我现在想要分类器不仅仅给我一个最优结果,我还想分类器给我一个这个结果对应的概率。这时候我们可以采用贝叶斯决策理论。
贝叶斯决策理论
百度对其的描述是: 贝叶斯决策理论,是主观贝叶斯派归纳理论的重要组成部分。 贝叶斯决策就是在不完全情报下,对部分未知的状态用主观概率估计,然后用贝叶斯公式对发生概率进行修正,最后再利用期望值和修正概率做出最优决策。 我听不懂,不妨以一个高数题入局。当我还是个大学生的时候,觉得高数没什么用,现在觉得自己当时太年轻了。
废话就不说了,我们做一个高数题:
人的性别由一对性染色体决定:男为XY,女为XX,每个人从父母处各得到一个性染色体,色盲基因由X染色体携带,且若男性的X染色体有此基因则男性患色盲,女性则要两个X染色体均有此基因才患色盲,而两个X是否有色盲基因是独立的。设色盲基因出现概率为0.08。又设男女婴出生比为110:100。问一新生儿有色盲的概率是多少?
这是一个高数的典型题目,其实不难,我们只要知道,男孩如果出现色盲基因必须是色盲,概率是百分比,女生是色盲的概率是 色盲基因 ** 2。那么结果是
# 定义已知概率
p_colorblind_gen