
机器学习
机器学习,西瓜书
AsajuHuishi
Github:https://github.com/AsajuHuishi
展开
-
sklearn手写体数据集 Dataloader分batch训练
from sklearn.datasets import load_digitsfrom torch.utils.data import DataLoaderimport numpy as npdigits = load_digits()img = digits['images'] #(1797,8,8)img = img[:,np.newaxis,:,:] #(1797,1,8,8)dataloader = DataLoader(img, batch_size=4, shuffle=Tru原创 2020-05-19 14:55:14 · 1031 阅读 · 0 评论 -
Python机器学习可视化(二)sklearn.validation_curve选择超参数实例(完整代码)
介绍Scikit-learn提供了learning_curve类,方便获得和训练的可视化相关的数据。例如,如果想要观察训练集使用不同样本数量和训练得分/测试得分的关系,可以使用learning_curve函数,在Python机器学习可视化(一)sklearn.learning_curve中介绍了训练样本数量——训练/测试得分曲线。机器学习的方法中往往涉及到超参数的调整,本文利用validation_curve函数,以load_digit数据集和SGD分类为例,通过可视化的方式来考察不同超参数和性能原创 2020-05-17 13:53:00 · 3497 阅读 · 0 评论 -
Python 西瓜书编程实现标准BP算法和累积BP算法+loss可视化(可以直接运行)
西瓜数据集3.0标准BP算法:求单个样本的均方误差(公式5.4);参数更新非常频繁;需要更多次数迭代。累积BP算法:求所有训练样例的均方误差(公式5.16);参数更新频率低得多;累积误差下降到一定程度之后,进一步下降慢。# -*- coding: utf-8 -*-#单隐层网络import pandas as pdimport numpy as npfrom sk...原创 2020-04-05 21:48:40 · 6348 阅读 · 2 评论 -
Python 西瓜书 使用数据集3.0α线性核和高斯核训练SVM+散点图可视化
西瓜数据集3.0α# -*- coding: utf-8 -*-import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svmimport pandas as pdfrom sklearn.metrics import accuracy_score#返回正确的比例from sklearn.preproc...原创 2020-04-01 15:17:36 · 5181 阅读 · 1 评论 -
西瓜书 数据集3.0α
编号,密度,含糖率,好瓜1,0.697,0.46,是2,0.774,0.376,是3,0.634,0.264,是4,0.608,0.318,是5,0.556,0.215,是6,0.403,0.237,是7,0.481,0.149,是8,0.437,0.211,是9,0.666,0.091,否10,0.243,0.267,否11,0.245,0.057,否12,0.343,...原创 2020-04-01 12:04:38 · 6997 阅读 · 0 评论 -
Python 西瓜书 拉普拉斯修正的朴素贝叶斯分类器(可以直接运行)
根据西瓜书的西瓜数据集3.0,实现拉普拉斯修正的朴素贝叶斯分类器。# -*- coding: utf-8 -*-import pandas as pdimport math##朴素贝叶斯分类器def fun(sigma,mu,xi):#概率密度函数 return 1/(math.sqrt(2*math.pi)*sigma)*math.exp(-(xi-mu)**2/(2*sig...原创 2020-03-26 20:20:24 · 3795 阅读 · 1 评论 -
python 西瓜书决策树实现(可以直接运行)
在西瓜数据集2.0上基于信息增益准则生成决策树。用python 写一个递归函数就可以实现了。# -*- coding: utf-8 -*-###以西瓜书76为例决策树import pandas as pdimport numpy as npimport mathimport copy#计算信息熵def Information_Entropy(plist): ent =...原创 2020-03-26 17:10:01 · 7854 阅读 · 7 评论 -
Python机器学习入门: sklearn.learning_curve 训练结果可视化实例(完整代码)
介绍Scikit-learn提供了learning_curve类,方便获得和训练的可视化相关的数据。例如,如果想要观察训练集使用不同样本数量和训练得分/测试得分的关系,可以使用learning_curve函数可视化,得到训练样本数量——训练/测试得分曲线如下。本文将具体介绍实现过程。from sklearn.learning_curve import learning_curve, v...原创 2020-05-06 14:00:07 · 6599 阅读 · 2 评论