周志华《机器学习》习题1.2

环境:PyCharm Professional 2019.1 + Python 3.7 + win 10

一共三个属性,分别有 2, 3 , 3 个属性值。假设空间规模 3 × 4 × 4 + 1 = 49 。去除空还剩 48,其中不含通配符的假设有 2 × 3 × 3 = 18 个。其余假设均可以由不含通配符的假设析取获得。
由递归和迭代两种方式实现求解,其中递归方式更容易理解

递归方式:

#!/use/bin/env python3
# -*- coding: utf-8 -*-
import time

# 所有假设映射为二进制,三种属性,属性值分别为 2 3 3 个,故可以用 8 位二进制位表示
hypo_old = [0xff, 0xf9, 0xfa, 0xfc, 0xcf, 0xd7, 0xe7, 0x7f,
            0xbf, 0xc9, 0xca, 0xcc, 0xd1, 0xd2, 0xd4, 0xe1,
            0xe2, 0xe4, 0x79, 0x7a, 0x7c, 0xb9, 0xba, 0xbc,
            0x4f, 0x57, 0x67, 0x8f, 0x97, 0xa7, 0x49, 0x4a,
            0x4c, 0x51, 0x52, 0x54, 0x61, 0x62, 0x64, 0x89,
            0x8a, 0x8c, 0x91, 0x92, 0x94, 0xa1, 0xa2, 0xa4]

# 不含有通配符的假设映射为二进制
hypo_leaf = [0x49, 0x4a,
             0x4c, 0x51, 0x52, 0x54, 0x61, 0x62, 0x64, 0x89,
             0x8a, 0x8c, 0x91, 0x92, 0x94, 0xa1, 0xa2, 0xa4]

# 每个假设可以由哪些不含通配符的假设构成
hypo_const = []
for i in range(48):
    hypo_const.append(0)
# print(hypo_const)
# print(len(hypo_const))

# 一共十八个不含通配符的假设,用十八位来表示
new_leaf = [0x20000, 0x10000,
            0x08000, 0x04000, 0x02000, 0x01000,
            0x00800, 0x00400, 0x00200, 0x00100
### 周志华机器学习》课后习题答案 对于周志华机器学习》书中第一章的部分习题解答如下: #### 表1.1中若只包含编号为1和4的两个样例,试给出相应的版本空间 当表1.1仅保留编号为1和4的样例时,版本空间是指所有能与这两个样例相一致的假设集合。由于只有两个样例,因此可以构建出较为具体的版本空间描述[^1]。 ```python # Python伪代码展示如何枚举可能的假设组合 def generate_version_space(): attributes = ['Sunny', 'Warm', '?', 'Normal', 'Young'] version_space = [] # 枚举满足条件的假设 for sky in ['Sunny', '?']: for temperature in ['Warm', '?']: for humidity in ['?', 'High', 'Normal']: for wind in ['Strong', '?']: for water in ['Warm', '?']: for forecast in ['Same', '?']: hypothesis = [sky, temperature, humidity, wind, water, forecast] # 判断该假设是否符合给定的正实例 if (hypothesis[:3] == ['Sunny', 'Warm', 'Normal'] or '?' in hypothesis[:3]) and \ (hypothesis[-2:] == ['Warm', 'Same'] or '?' in hypothesis[-2:]): version_space.append(hypothesis) return version_space ``` 上述Python伪代码展示了如何通过编程方式来列举符合条件的假设列表,从而形成版本空间的一部分。 #### 若数据包含噪声,则假设空间中有可能不存在与所有训练样本都一致的假设,在此情形下,试设计一种归纳偏好用于假设选择 面对含噪数据的情况,可以选择引入某种形式的归纳偏置或偏好原则来进行更稳健的学习过程。例如,采用奥卡姆剃刀原理(Occam's Razor),即倾向于选择最简单的解释作为最终模型;或是基于最大似然估计(Maximum Likelihood Estimation)的方法去挑选那些能够最大化观察到的数据概率分布下的参数配置。
评论 1
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值