
机器学习
Cpsu
个人笔记
展开
-
机器学习——感知机及K近邻
一、感知机 import numpy as np from matplotlib import pyplot as plt np.random.seed(3) #其实这里应该用x1=np.linspace(0,5,50) #X轴数据集 x1=[i for i in np.arange(0,5,0.1)] #正样本数据集 x2=np.abs(np.random.randn(50)) #负样本数据集 x3=np.abs(np.random.randn(50)+8) plt.scatter(x1,x2) plt原创 2022-05-27 21:16:28 · 186 阅读 · 0 评论 -
机器学习——主成分分析(PCA)
#先随便创建一个具有相关性的数据集 import numpy as np from matplotlib import pyplot as plt from numpy import linalg np.random.seed(2) #构造数据集 x1=[i for i in np.arange(1,10,0.1)] x2=[np.random.uniform(2,4)*i+np.random.randn() for i in x1] plt.scatter(x1,x2) #zeros创建一个符合sha原创 2022-05-23 00:28:06 · 188 阅读 · 0 评论 -
机器学习——决策树
西瓜书决策树 了解决策树算法后,巩固和理解算法,编程实现信息熵。一开始打算直接用pandas读取的数据进行计算。但是计算信息增益的时候发现数据选取太麻烦,所以还是需要参考将DataFrame转为向量形式。 #决策树 #计算根结点信息熵 dataset=pd.read_excel("watermelon.xlsx") label=dataset["好瓜"].value_counts() Ent=0 for target in label.index: Ent+=-(label[target]/lab原创 2022-05-11 21:41:04 · 334 阅读 · 0 评论 -
机器学习——线性回归
西瓜书线性回归 为了加深理解,不用框架自己编程实现。 由于缺少数据,就自己创建一个数据。自定义一个一元线性函数,然后通过random创建一个围绕该直线波动的数据集。将函数写成西瓜书上的向量形式 import numpy as np import matplotlib.pyplot as plt from numpy.linalg import * #一次函数 def ture_fun(x): return 1.75*x+1.5 #利用random选取40个围绕直线波动的数据 np.r原创 2022-04-28 19:19:49 · 1087 阅读 · 0 评论