自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 【数据降维】PCA和LDA方法的区别

通过线性投影(找新的坐标系),将高维的数据映射到低维的空间表示,使用较少的数据维度,保留较大的数据信息。这边解释一下为什么要使方差最大,也就是在新坐标系上落点尽量分散,。举个极端的例子,如果方差足够小,那在直线上会落在同一点上,那这时候保存的信息量就只有一个。

2025-07-07 17:11:01 430

原创 【易懂】训练集优化(接上文泰坦尼克号实例)

由于计算机无法直接识别文本,只能识别01,这时候就需要对文本进行编码。举个例子,如果去餐厅,菜单上有三种饮品,咖啡,茶和果汁。onehot编码就是把1看成是选择,0看成是不选择。前面说到上一种方法并非最优的模型及数据处理方法,所以下面便说明如何从数据优化的方面进行优化(后续会对各分类模型进行比较及解释)然后对名称中的头衔进行处理,将最常见的称号分组。首先对缺失值进行处理,使用平均值进行填充。头衔和Pclass也进行onehot编码。对年龄段进行分组并进行onehot编码。然后再使用之前的模型进行训练。

2025-07-01 17:13:32 290

原创 【易懂】分类模型——使用逻辑回归模型(泰坦尼克号幸存者预测)

可以看出使用逻辑回归模型实例的准确率并没有很高,只考虑到了线性回归关系而没有考虑非线性关系,后续可以通过对数据处理进行优化以及多模型使用方式进行改善(end)

2025-06-30 16:33:03 676

原创 Kaggle注册时出现验证码无法显示Captcha must be filled out错误时应该如何处理?

首先,在扩展一栏中点击获取扩展,搜索Header Editor,点击管理扩展,进入页面后点击详细信息。在导入与导出中输入,点击下载就可以了。

2025-06-30 15:15:12 190

原创 在Header Editor中导入url失败,出现failed to fetch错误

之前在注册Kaggle时验证码不显示,出现:Captcha must be filled out 的错误,于是就去网上找答案,发现可以通过下载Header Editor插件然后导入。来解决,但是在导入过程中又遇到了问题,出现了failed to fetch错误,没有在网上找到解决方法,于是就想写一下自己的解决过程。第二种就是我使用的方法,使用命令行进行下载,先在自己确定的路径下创建json文件,然后在命令行输入。例如D:/data/1.json,此时就可以将字典内容下载下来,然后点左上角导入文件进行导入。

2025-06-27 09:32:53 304 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除