自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 决策树算法

决策树( Decision Tree) 又称为判定树,是数据挖掘技术中的一-种重要的分类与回归方法,它是一种以树结构(包括二叉树和多叉树)形式来表达的预测分析模型。决策树(Decision Tree) 是有监督学习的一种算法。决策树有两种:分类树和回归树。优点(1)速度快:计算量相对较小,且容易转化成分类规则。只要沿着树根向下一直走到叶,沿途的分裂条件就能够唯一确定一条分类的谓词。(2)准确性高:挖掘出的分类规则准确性高,便于理解,决策树可以清晰的显示哪些字段比较重要。

2023-09-20 13:40:38 339 1

原创 线性回归算法

回归最简单的定义是,给出一个点集D,用一个函数去拟合这个点集,并且使得点集与拟合函数间的误差最小,如果这个函数曲线是一条直线,那就被称为线性回归,如果曲线是一条二次曲线,就被称为二次回归。

2023-09-20 13:13:45 272 1

原创 贝叶斯算法

一般来说,如果样本特征的分布大部分是连续值,使用高斯朴素贝叶斯会比较好。如果样本特征的分布大部分是多元离散值,使用多项式朴素贝叶斯比较合适。如果样本特征是二元离散值或者很稀疏的多元离散值,应该使用伯努利朴素贝叶斯比较合适。

2023-09-14 14:04:20 2580 2

原创 KNN算法

简单易用,相比其他算法,KNN算是比较简洁明了的算法。即使没有很高的数学基础也能搞清楚它的原理。模型训练时间快,上面说到KNN算法是惰性的,这里也就不再过多讲述。预测效果好。对异常值不敏感对内存要求较高,因为该算法存储了所有训练数据预测阶段可能很慢对不相关的功能和数据规模敏感。

2023-09-14 13:43:12 153 1

原创 机器学习笔记 数据预处理02

数据预处理是机器学习中至关重要的一步,能够提高模型的准确性和鲁棒性。预处理步骤包括数据清洗、特征选择、特征缩放、特征转换、特征编码、数据集划分、数据平衡和数据转换。根据具体问题和数据情况,选择合适的预处理方法能够提高模型性能和效果。

2023-09-06 18:37:19 279 1

原创 机器学习笔记 数据预处理01

异常值是指样本中的个别值,其数值明显偏离它所属样本集的其余观测值。异常值分析是检验数据是否有录入错误以及含有不合常理的数据。忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会产生不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。异常值也称为离群点,异常值的分析也称为离群点分析。

2023-09-06 17:31:05 1891 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除