
机器学习
YYin0914
这个作者很懒,什么都没留下…
展开
-
kaggle-数据处理的部分做法
1、从.csv文件中读取文件内容;将DataFrame对象存放到.csv文件中#读取文件内容train = pd.read_csv('train.csv',index_col=0)#读取内容时,如果每行前面有索引值,舍去#将DataFrame类型的对象(最终提交的结果形式),转换为.csv文件result = pd.DataFrame({'PassengerId':data_test['PassengerId'].values,'Survived':prediction.astype(np.i原创 2020-06-05 15:24:59 · 1114 阅读 · 0 评论 -
朴素贝叶斯理解及实现
一、朴素贝叶斯算法朴素贝叶斯算法是一种有监督的学习算法,可以解决分类的问题。对于给定的训练数据集,首先基于特征条件独立假设学习输入和输出的联合概率分布,然后基于此模型,当给定输入的x时,利用贝叶斯定理求出后验概率最大的输出y值。假设目前我们的数据集,其中的所有的数据可以分为两类。使用p1表示属于其中一类的概率,p2表示属于另一种的概率,输入新的数据点(x,y),如果在该点的p1(x,y)>p2(x,y),则该点属于类别1,反之属于类别2。因此朴素贝叶斯算法最终返回的是所属的类别中概率值最大的类原创 2020-06-02 10:01:45 · 1186 阅读 · 0 评论 -
KNN的理解和实现
一、KNN算法的思想通过一定的方法度量其他样本到目标样本的距离,选取距离最近的k个样本,当这k个样本大多数分类的结果都属于某一个类别时,则判断目标样本也是属于这个类别的。常用的衡量距离的方式主要有两种:曼哈顿距离和欧式距离样本的特征空间:两个样本集都是含有n为特征的数据集,(1)曼哈顿距离:(2)欧氏距离:这里我们使用欧式距离L2作为衡量的尺度,实现简单数据的分类import numpy as npimport operator'''parameters:原创 2020-05-27 15:19:31 · 347 阅读 · 0 评论