《西瓜书》第七章课后习题

该博客探讨了机器学习中的几个关键概念,包括极大似然估计在西瓜数据集上的应用,证明条件独立性不成立时朴素贝叶斯分类器的最优性,实现拉普拉斯修正的朴素贝叶斯分类器,讨论高维数据下防止概率下溢的策略,以及解释了二分类任务中高斯分布和线性判别分析的关系。还涉及到了朴素贝叶斯分类器中先验概率估算所需样例数的计算,并分析了特定数据结构下变量的条件独立性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

7.1试使用极大似然法估算西瓜数据集3.0中前3个属性的类条件概率。

极大似然就是进行概率假设,然后对假设的概率分布参数进行估计

假设第一个属性色泽概率分布为:
P(色泽=青绿|好瓜)= ξ 1 \xi_1 ξ1
P(色泽=乌黑|好瓜)= ξ 2 \xi_2 ξ2
P(色泽=浅白|好瓜)= ξ 3 = 1 − ξ 1 − ξ 2 \xi_3=1-\xi_1-\xi_2 ξ3=1ξ1ξ2
似然函数:
L ( ξ ) = ∏ i P ( 色 泽 = x i ∣ 好 瓜 ) = ξ 1 3 ξ 2 4 ( 1 − ξ 1 − ξ 2 ) L(\xi)=\prod_i P(色泽=x_i|好瓜)=\xi_1^3\xi_2^4(1-\xi_1-\xi_2) L(ξ)=iP(=xi)=ξ13ξ24(1ξ1ξ2)
L ( ξ 1 ) ′ = ξ 1 2 ξ 2 4 ( 3 − 4 ξ 1 − 3 ξ 2 ) {L(\xi_1)}'=\xi_1^2\xi_2^4(3-4\xi_1-3\xi_2) L(ξ1)=ξ12ξ24(34ξ13ξ2)
L ( ξ 2 ) ′ = ξ 1 3 ξ 2 3 ( 4 − 4 ξ 1 − 5 ξ 2 ) {L(\xi_2)}'=\xi_1^3\xi_2^3(4-4\xi_1-5\xi_2) L(ξ2)=ξ13ξ23(44ξ15ξ2)
L ( ξ 1 ) ′ = L ( ξ 2 ) ′ = 0 {L(\xi_1)}'={L(\xi_2)}'=0 L(ξ1)=L(ξ2)=0
ξ 1 = 3 8 \xi_1=\frac{3}{8}

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值