机器学习
黎明中的花朵
沉醉不知处
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
机器学习算法(十) 根据幸福感问卷调查做预测
1,数据准备 问卷调查数据主要包含的个人信息有职业,婚姻状况,收入,学历等40个features,label就是幸福感。 首先对数据进行预处理 (一) 第二列是数据特征,先独立抽取出来。 (二)第六列是时间,本身对结果影响不大,又由于是字符串,先把他删除。 (三)数据本身包含20197个空缺,对数据进行补充 2,训练和预测 给定的数据包含train和test两部分,先用train进行模型的建立,然后用test进行测试训练结果。 ...原创 2020-12-24 20:22:04 · 1708 阅读 · 1 评论 -
机器学习算法(九) K近邻算法-对模拟数据回归&KNN预处理和分类马绞痛数据
利用k近邻对模拟数据回归&KNN预处理和分类马绞痛数据 import numpy as np import matplotlib.pyplot as plt from sklearn.neighbors import KNeighborsRegressor np.random.seed(0) # random 40,1 0-5 matrix, axis=0,1 sort by column,row X = np.sort(5 * np.random.rand(40, 1), axis = 0原创 2020-12-23 15:06:40 · 429 阅读 · 2 评论 -
机器学习算法(八) k近邻算法-分类
对两组数据进行分类和可视化 import numpy as np import matplotlib.pyplot as plt from matplotlib.colors import ListedColormap from sklearn.neighbors import KNeighborsClassifier from sklearn import datasets # data prepare iris = datasets.load_iris() X = iris.data[:, :原创 2020-12-22 17:49:24 · 383 阅读 · 3 评论 -
机器学习算法(七) k近邻算法
K近邻(k Nearest Neighbors),顾名思义,就是对新数据进行判别时,它的类别由和它距离最近的k个已有数据来确定。 1,k值的选取 不断改变k的值,通过计算集合的方差,进行交叉验证,选取分类最好的作为最终k值。通常在[2,20]范围内选取。 2,距离的计算 样本之间的距离的计算,我们一般使用LP距离进行计算。当p=1时候,称为曼哈顿距离(Manhattan distance),当p=2时候,称为欧氏距离(Euclidean distance),当p=∞时候,称为极大距离(inft.原创 2020-12-21 14:59:07 · 340 阅读 · 0 评论 -
机器学习算法(六) 贝叶斯分类-模拟离散数据
贝叶斯对模拟离散数据的训练,评估和预测 # import package import random import numpy as np from sklearn.naive_bayes import CategoricalNB from sklearn.model_selection import train_test_split # data prepare rng = np.random.RandomState(1) X = rng.randint(5, size = (600, 100))原创 2020-12-20 11:42:11 · 362 阅读 · 2 评论 -
机器学习算法(五) 贝叶斯分类-鸢尾花数据集
基于贝叶斯对鸢尾花数据进行分类 1. python3.7 2. numpy >= '1.16.4' 3. sklearn >= '0.23.1' # import base package import warnings warnings.filterwarnings('ignore') import numpy as np from sklearn import datasets from sklearn.naive_bayes import GaussianNB fro.原创 2020-12-19 17:25:13 · 2645 阅读 · 2 评论 -
机器学习算法(四) 朴素贝叶斯
线性分类: 硬分类,直接输出观测对应的分类。 线性判别分析 感知机 软分类,通过概率得到, 概率生成(注重不同特征之间的关系):高斯判别分析和朴素贝叶斯 概率判别(注重特征和标签的关系):Logistic 回归 思想:朴素贝叶斯假设(目的:简化运算) 条件独立性假设 简单的概率图(有向图)模型 给定x, 求y ? 0|1 P(y) 二分类:y~伯努利分布 多分类:y~categorial 分布 如果x离散,xi一般是ca...原创 2020-12-18 14:01:14 · 153 阅读 · 0 评论 -
线性回归
线性回归:根据旧的输入数据和结果得到一些常量,将新的输入项分别乘以这些常量,再将结果加起来得到新的输出。 一般将平方误差作为损失函数,记为 ...原创 2019-07-08 17:28:56 · 172 阅读 · 0 评论 -
决策树的创建
决策树的选取规则就是使得不纯度降低,或降低混乱程度的过程 信息熵的定义: 一个事件的信息量随着其发生概率儿减小,且不能为负 对于两个不相关的事件x,y。那么观察到两个事件同事发生获取的信息量等于观察各自发生得到的信息量。 h(x,y) = h(x) + h(y) 如果x,y是互不相关事件,那么满足p(x,y) = p(x) * p(y) 从上面的推到可以看出h(x),p(x)之间...原创 2017-10-18 17:46:52 · 399 阅读 · 0 评论