
机器学习
文章平均质量分 61
胡 亥
京都大学
展开
-
数据分析工具Pandas
数据分析工具Pandas创建序列(Series)创建数据框(DataFrame)查看数据创建序列(Series)import numpy as npimport pandas as pds = pd.Series(np.arange(10)) # 以 0~9 的数组生成Seriesprint(s)输出结果为:0 01 12 23 34 45 56 67 78 89 9dtype: int32可以看到Serie原创 2021-11-06 00:22:37 · 410 阅读 · 0 评论 -
科学计算包Numpy
科学计算包Numpy科学计算包Numpy安装引用手动创建数组函数创建数组数组运算数组索引数组的统计分析数组的矩阵操作科学计算包Numpy安装pip install numpy引用import numpy手动创建数组创建一维数组:# 导入numpy库,将numpy简化为npimport numpy as np# 创建一维数组array = np.array([1,2,3,4])# 打印数组print(array)输出结果为:[1 2 3 4]创建多维数组:# 导入原创 2021-11-05 16:33:35 · 381 阅读 · 0 评论 -
为什么最大似然函数最大,θ就最有可能?
最大似然估计:现在已经拿到了很多个样本(你的数据集中所有因变量),这些样本值已经实现,最大似然估计就是去找到那个(组)参数估计值,使得前面已经实现的样本值发生概率最大。因为你手头上的样本已经实现了,其发生概率最大才符合逻辑。这时是求样本所有观测的联合概率最大化,是个连乘积,只要取对数,就变成了线性加总。此时通过对参数求导数,并令一阶导数为零,就可以通过解方程(组),得到最大似然估计值。...原创 2020-10-14 01:56:00 · 1577 阅读 · 0 评论 -
后验概率和极大似然估计
后验概率后验概率是指在得到“结果”的信息后重新修正的概率。是“执果寻因”问题中的“果”,后验概率的计算要以先验概率为基础。例如,后验概率p(y=1∣x)p(y=1|x)p(y=1∣x)的意思是:拿到xxx后,y=1y=1y=1的概率(xxx分类为类别111的概率)极大似然估计极大似然估计是求估计的一种方法。求解步骤:写出似然函数对似然函数取对数,并整理求导数解似然方程...原创 2020-02-22 15:57:28 · 418 阅读 · 0 评论 -
机器学习西瓜书:评估方法
通常,我们可以通过实验测试来对学习器的泛化误差进行评估并进而做出选择留出法“留出法”直接将数据集DDD划分为两个互斥的集合,其中一个集合作为训练集SSS,另一个作为测试集TTT,即D=S∪TD=S\cup TD=S∪T,S∩T=∅S\cap T = \varnothingS∩T=∅。注意:训练/测试集的划分要尽可能保持数据分布的一致性,避免因数据划分过程引入额外的偏差而对最终结果产生影响...原创 2020-02-17 15:27:53 · 355 阅读 · 0 评论 -
机器学习西瓜书:经验误差与过拟合
错误率=分类错误的样本数样本总数错误率=\dfrac{分类错误的样本数}{样本总数}错误率=样本总数分类错误的样本数精度=1−错误率=1−分类错误的样本数样本总数精度=1-错误率=1-\dfrac{分类错误的样本数}{样本总数}精度=1−错误率=1−样本总数分类错误的样本数误差=实际预测输出样本的真实输出误差=\dfrac{实际预测输出}{样本的真实输出}误差=样本的真实输出实际预测输出...原创 2020-02-15 02:51:45 · 335 阅读 · 0 评论 -
机器学习西瓜书:归纳偏好和没有免费午餐定理
归纳偏好:机器学习算法在学习过程中对某种类型假设的偏好,称为“归纳偏好”或简称为“偏好”。偏好的原则:奥卡姆剃刀:若有多个假设与观察一致,则选择最简单的那个。没有免费午餐定理:首先约定如下:样本空间χ\chiχ:离散的假设空间H\EtaH:离散的LaL_aLa:一个训练出的算法XXX:训练数据,X∈χX\in\chiX∈χhhh:算法LaL_aLa基于训练数据XXX产生的假...原创 2020-02-15 01:28:30 · 956 阅读 · 0 评论 -
机器学习西瓜书:假设空间
归纳与演绎是科学推理的两大基本手段归纳:从特殊到一般的“泛化”过程,即从具体的事实归结出一般性规律。演绎:从一般到特殊的“特化”过程,即从基础原理推演出具体状况。例如,在数学公理系统中,基于一组公理和推理规则推导出与之相洽的定理,这是演绎。而“从样例中学习”显然是一个归纳过程,因此亦称“归纳学习”。归纳学习:广义:从样例中学习狭义:从训练数据中学得概念(称为概念学习或概念形...原创 2020-02-14 23:07:25 · 563 阅读 · 0 评论 -
机器学习西瓜书:基本术语
数据集(data set)一组记录的集合,例如:(色泽=青绿;根蒂=蜷缩;敲声=浊响)(色泽=乌黑;根蒂=稍蜷;敲声=沉闷)(色泽=浅白;根蒂=硬挺;敲声=清脆)…用D={x1,x2,...,xm}D=\lbrace x_1,x_2,...,x_m \rbraceD={x1,x2,...,xm}表示包含mmm个示例的数据集,每个示例有ddd个属性描述:xi=(xi1xi2⋮x...原创 2020-02-08 17:26:59 · 466 阅读 · 0 评论 -
机器学习:没有免费午餐定理(No Free Lunch Theorem)
如果我们不对特征空间有先验假设,则所有算法的平均表现是一样的原创 2020-02-06 02:45:08 · 1655 阅读 · 0 评论 -
机器学习:学习的分类
Supervised learning——SVM,Neural,networksUnsupervised learning——Clustering,EM algorithm,PCASemi-Supervised learningReinforcement learning——自动驾驶通用Supervised learningclassificationregression可以使用回归...原创 2020-02-06 00:33:55 · 140 阅读 · 0 评论