- 博客(5)
- 收藏
- 关注
原创 偏差、方差对比
机器学习中,有两个很重要的工具,用于评价算法,并且可以反映出算法是泛化能力。这就是偏差和方法。1.偏差:期望输出与真实标记的区别计算上,就是 偏差^2 =(均值-正确值)^22.方差:输出对于均值的偏离程度计算上,就是 方差 = ((输出-均值)^2)的期望3.噪声:期望值(预测值)与真实值的差距计算上,就是 噪声^2 = ((...
2020-03-13 16:53:06
719
原创 kNN算法(k-临近算法)
kNN算法应该是一个最简单的分类算法首先,存在一个有标签的样本数据集,然后输入无标签数据,将新输入是数据对应的特征值进行比较,让背后算法提取样本集中特征最相似数据,即为最邻近的分类标签。一般我们取前k个最相似的数据,并且以其中出现次数最多的分类作为新数据的分类。算法中有三个基本因素:k值、距离度量、分类决策规则,在这个算法中,我们一般以欧式距离作为判别的度量方式。(内容来源于机器学习实战)...
2020-03-12 12:23:41
500
原创 机器学习----linear models和kernel models总结
最近看了台湾大学林轩田教授的《机器学习》相关课程,总结一下课程中讲解的linear models和kernel models,课程中总结的位置在《机器学习技巧》6-4(第六周,第四节)视频中的截图线性模型(linear models 的总结图)从图中可以看到我们在机器学习领域中熟知的线性模型。线性模型和Kernel模型总结图(linear/kernel models)从图中可以看到,...
2020-03-04 17:44:15
1579
原创 append方法和concat方法对比
放假看书有一些想法,写一下。a.append(b,ignore_index=True),追加,index顺序增加pandas.concat([a,b]) a,b合并,index不变import pandasfrom pandas import DataFramea = DataFrame({'math':[85,50,65],'chinese':[90,85,60]})b = Data...
2020-02-25 16:25:00
1282
1
原创 pandas.Series.rank()用法的理解
今天看了《基于python的大数据分析基础及实战》看到了pandas.Series.rank()默认情况下的结果注:pandas.Series.rank()把对象的value替换为数值等级(相应的名次)。import pandas as pdfrom pandas import Seriesser = Series([4,2,0,3],index=list('abcd'))ser.ran...
2020-02-25 16:03:54
2087
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人