
Algorithm
文章平均质量分 50
该专栏是完成一些算法作业
平凡的小何同学
已转行。
展开
-
机器学习代码笔记-朴素贝叶斯
主题:朴素贝叶斯 类别:个人机器学习笔记(数学推导见上传的手写PDF) 书籍参考:《机器学习实战》、《统计学习》、《机器学习》 import numpy as np import pandas as pd import math 创建数据集: def createDataXG20(): data = np.array([['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑'] , ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷',原创 2021-06-08 19:43:03 · 352 阅读 · 0 评论 -
机器学习代码笔记-核SVM
类别:个人机器学习笔记(数学推导见上传的手写PDF) 书籍参考:《机器学习实战》、《统计学习》、《机器学习》 任务: 学习线性SVM和非线性SVM的梯度下降方法。选取合适的参数(e.g. C=10, eta=0.001, sigma=0.1),并利用gaussian核进行上述数据集的非线性svm分类 import numpy as np import matplotlib.pyplot as plt from sklearn.datasets import make_moons #数据初始化 m = 20原创 2021-06-08 19:38:00 · 365 阅读 · 0 评论 -
机器学习-SM0算法
类别:个人机器学习笔记(数学推导见上传的手写PDF) 书籍参考:《机器学习实战》、李航《统计学习》、周志华西瓜书《机器学习》 目标: 1)尝试理解smoSimple的核心原理,对关键步骤做出注释。 2)导入data.txt,利用smoSimple找到对应的支撑向量。 3)求出对应的支撑线和分界线,并和原始数据集一起绘制在同一图例中。 import matplotlib.pyplot as plt from numpy import * import numpy as np import warnings原创 2021-06-08 19:34:23 · 2672 阅读 · 0 评论 -
机器学习-神经网络
类别:机器学习个人学习笔记 算法:神经网络 数据:月亮数据集,Python自带 书籍:《机器学习实战》、周志华西瓜书《机器学习》、李航《统计学习方法》 import numpy as np import numpy as np import warnings from sklearn.datasets import load_digits from sklearn.metrics import confusion_matrix, classification_report from sklearn.p原创 2021-06-08 19:29:30 · 352 阅读 · 0 评论 -
机器学习-连续型分类树
类别:个人机器学习笔记(数学推导见上传的手写PDF) 书籍参考:《机器学习实战》、《统计学习》、《机器学习》 任务:结合离散决策树的判别准则和连续型决策树的特征选取方法,生成下面数据的连续型分类树 #调用一些包 import numpy as np import math import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['SimHei'] plt.rcParams['axes.unicode_minus'] = False原创 2021-06-08 19:11:56 · 414 阅读 · 0 评论 -
机器学习-离散型决策树
类别:机器学习个人学习笔记 参考书籍:《机器学习实战》、统计学习、西瓜书 任务: 1.针对西瓜数据集,通过信息增益,信息增益率和Gini指数分别得到决策树的根节点。 2.补充上述代码(或自行完成代码编写),针对上述西瓜数据集,用信息增益作为决策准则,生成相应的决策树,输出对应的决策树决策过程, #调用一些包 import numpy as np import math import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['Sim原创 2021-06-08 19:02:08 · 831 阅读 · 0 评论 -
机器学习-logistic回归训练数据集
类别:机器学习个人笔记 参考书籍:《统计学习》、《机器学习实战》、周志华大佬的西瓜书 相关数学公式推导见我上传的手写PDF 任务: 学习《机器学习实战》P78页及P79页程序清单5-1和5-2,完成以下问题: 1)导入数据集’testSet.txt’,用logistic回归训练数据集,并画出决策边界。 2)导入数据集’data.txt’,用logistic回归训练数据集,并画出决策边界。 # 导包 from numpy import * import pandas as pd import numpy as原创 2021-06-08 18:56:11 · 2898 阅读 · 1 评论 -
机器学习-线性回归,局部加权线性回归和岭回归
参考书籍: 《机器学习实战》 相关数学推导知识笔记见我上传的手写pdf 任务: 1)读取数据集’abalone.txt’,输出线性回归最佳参数以及预测值和真实值的误差平方和。 2)读取数据集’ex0.txt’,将数据集分成合适的训练集和测试集,用局部线性回归模型训练数据,选取你认为最佳sigma数值,并说明原因。 提示:分离训练集和测试集代码可参考。 from numpy import * import matplotlib.pyplot as plt def loadDataSet(fileName)原创 2021-06-08 18:47:43 · 456 阅读 · 0 评论 -
@[Algorithm]1.K-meams++算法实现
一.理解什么是K-means算法 1.算法过程: (1)随机选取K个对象作为初始聚类中心; (2)将数据样本集合中的样本按照最小距离原则分配到最邻近聚类; (3)根据聚类的结果,重新计算K个聚类的中心,并作为新的聚类中心; (4)重复步骤2.3直到聚类中心不再变化。 2.数学表达式: n:样本数。 k:样本分为k类。 rnk:第n个样本点是否属于第k类,属于则rnk=1, 不属于则rnk=0。 ...原创 2019-10-26 22:03:10 · 645 阅读 · 0 评论