- 博客(5)
- 收藏
- 关注
原创 【数据降维】PCA和LDA方法的区别
通过线性投影(找新的坐标系),将高维的数据映射到低维的空间表示,使用较少的数据维度,保留较大的数据信息。这边解释一下为什么要使方差最大,也就是在新坐标系上落点尽量分散,。举个极端的例子,如果方差足够小,那在直线上会落在同一点上,那这时候保存的信息量就只有一个。
2025-07-07 17:11:01
430
原创 【易懂】训练集优化(接上文泰坦尼克号实例)
由于计算机无法直接识别文本,只能识别01,这时候就需要对文本进行编码。举个例子,如果去餐厅,菜单上有三种饮品,咖啡,茶和果汁。onehot编码就是把1看成是选择,0看成是不选择。前面说到上一种方法并非最优的模型及数据处理方法,所以下面便说明如何从数据优化的方面进行优化(后续会对各分类模型进行比较及解释)然后对名称中的头衔进行处理,将最常见的称号分组。首先对缺失值进行处理,使用平均值进行填充。头衔和Pclass也进行onehot编码。对年龄段进行分组并进行onehot编码。然后再使用之前的模型进行训练。
2025-07-01 17:13:32
290
原创 【易懂】分类模型——使用逻辑回归模型(泰坦尼克号幸存者预测)
可以看出使用逻辑回归模型实例的准确率并没有很高,只考虑到了线性回归关系而没有考虑非线性关系,后续可以通过对数据处理进行优化以及多模型使用方式进行改善(end)
2025-06-30 16:33:03
676
原创 Kaggle注册时出现验证码无法显示Captcha must be filled out错误时应该如何处理?
首先,在扩展一栏中点击获取扩展,搜索Header Editor,点击管理扩展,进入页面后点击详细信息。在导入与导出中输入,点击下载就可以了。
2025-06-30 15:15:12
190
原创 在Header Editor中导入url失败,出现failed to fetch错误
之前在注册Kaggle时验证码不显示,出现:Captcha must be filled out 的错误,于是就去网上找答案,发现可以通过下载Header Editor插件然后导入。来解决,但是在导入过程中又遇到了问题,出现了failed to fetch错误,没有在网上找到解决方法,于是就想写一下自己的解决过程。第二种就是我使用的方法,使用命令行进行下载,先在自己确定的路径下创建json文件,然后在命令行输入。例如D:/data/1.json,此时就可以将字典内容下载下来,然后点左上角导入文件进行导入。
2025-06-27 09:32:53
304
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人