《机器学习（周志华）》习题11.1 参考答案

最新推荐文章于 2022-10-21 21:18:31 发布

原创

最新推荐文章于 2022-10-21 21:18:31 发布 · 2.8k 阅读

3 ·

CC 4.0 BY-SA版权

本文介绍了编程实现机器学习中的Relief算法，并对其在西瓜3.0数据集上的应用效果进行了分析。尽管算法在某些方面存在假设和局限，如依赖最近邻且可能不适于高维数据，但作为编程练习有助于深入理解算法原理。然而，作者在实践中对此算法并不倾向于使用。

试编程实现Relief算法，并考察其在西瓜3.0上的结果。

# coding: utf-8
import numpy as np 

input_path = "西瓜数据集3.csv"
file = open(input_path.decode('utf-8'))
filedata = [line.strip('\n').split(',') for line in file]
filedata = [[float(i) if '.' in i.decode('utf-8') else i for i in row ] for row in filedata] # change decimal from string to float 
filedata = filedata[1:]
X = [row[1:-1] for row in filedata] # attributes
Y = [row[-1] for row in filedata] # class label 
weight = np.zeros(len(X[0]))

# Normalise
for row in X:
	row[-2] = (row[-2]-0.243) / (0.774-0.243)
	row[-1] = (row[-1]-0.042) / (0.46-0.042)

def cal_dis(a, b):
	ret = 0
	for i in range(len(a)):
		ai = a[i]
		bi = b[i]
		if type(a[i]) == float:
			ret += np.abs(ai-bi)
		else:
			ret += 0 if ai==bi else 1
	return ret 


def find_near(sample_id):
	global X, Y
	near_hit_id = -1
	near_miss_id = -1
	near_hit_dis = np.inf
	near_miss_dis = np.inf  
	sample_feat = X[sampl

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Wiking__acm

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

周志华西瓜书《机器学习》习题提示——第11章

qiy_icbc的博客

07-23

717

周志华西瓜书《机器学习》习题提示——第11章

周志华《机器学习》习题答案（不断更新中）

1 条评论

瓜州钟离Lee 2021.04.13
15,16行应该换成float类型：[code=python] row[-2] = (float(row[-2])-0.243) / (0.774-0.243) row[-1] = (float(row[-1])-0.042) / (0.46-0.042) [/code]