
机器学习
文章平均质量分 74
机器学习、sklearn
myaijarvis
开发不会,机器不学,自然语言不理
欢迎一起讨论O_o
展开
-
【Datawhale】【机器学习】糖尿病遗传风险检测挑战赛
截至2022年,中国糖尿病患者近1.3亿。中国糖尿病患病原因受生活方式、老龄化、城市化、家族遗传等多种因素影响。同时,糖尿病患者趋向年轻化。糖尿病可导致心血管、肾脏、脑血管并发症的发生。因此,准确诊断出患有糖尿病个体具有非常重要的临床意义。糖尿病早期遗传风险预测将有助于预防糖尿病的发生。......转载 2022-07-25 16:33:28 · 1348 阅读 · 0 评论 -
【机器学习】聚类(Kmeans、MeanShift )
参考【参考:5-01 聚类算法kmeans和MeanShift原理 + 零售案例实战(上)_哔哩哔哩_bilibili】【参考:机器学习/聚类/聚类算法 代码.ipynb · myaijarvis/AI - 码云 - 开源中国】结论:MeanShift比kmeans++效果要好点导库import numpy as npimport matplotlib.pyplot as pltimport pandas as pdfrom pandas import plottingimport原创 2022-04-16 17:57:02 · 2529 阅读 · 0 评论 -
【机器学习】预测宽带客户流失(决策树、随机森林 )
【参考:4-02 决策树 随机森林算法案例实战 用户流失预测(下)_哔哩哔哩_bilibili】【参考:机器学习/宽带用户流失/决策树 随机森林 预测宽带客户流失.ipynb · myaijarvis/AI - 码云 - 开源中国】学习:GridSearchCV调参数据分布不平衡 适合随机森林算法树模型参数:1.criterion gini or entropy2.splitter best or random 前者是在所有特征中找最好的切分点 后者是在部分特征中(数据量原创 2022-04-15 22:00:17 · 1874 阅读 · 1 评论 -
【Kaggle】纽约市出租车费预测(经典)
【参考:New York City Taxi Fare Prediction | Kaggle】【参考:美国纽约市出租车大数据探索-基于kaggle比赛_@Irene的博客-优快云博客】这个参考较多代码【参考:2 机器学习实战 纽约出租车车费预测_哔哩哔哩_bilibili】【参考:Kaggle-纽约市出租车费预测_qq_28584559的博客-优快云博客】import numpy as npimport pandas as pdimport matplotlib.pyplot as plt原创 2022-04-12 21:29:11 · 4469 阅读 · 2 评论 -
【机器学习】PCA降维
iris【机器学习的数学原理和算法实践 5.6】import numpy as npimport matplotlib.pyplot as plt# sklearn.decomposition.PCA 主要用于非线性数据的降维的KernelPCA# 【参考:[sklearn.decomposition.PCA-scikit-learn中文社区](https://scikit-learn.org.cn/view/610.html)】from sklearn import datasets, dec原创 2022-04-11 15:50:02 · 1143 阅读 · 0 评论 -
【Kaggle】房价预测
【参考:【Kaggle:房价预测】全球AI比赛实战训练营资料_哔哩哔哩_bilibili】视频讲解内容看数据的类型、空值、大小数据清洗方法常识性规则:人的寿命几百岁业务特定规则:这家店 每天都卖出去几万台手机类别型转化为数字或者one-hot编码数据处理实战思路:数据探索(查看数据之间的关系) => 数据清洗(比如空值填充)=> 数据预处理(比如归一化、标准化等)=> 模型构建 => 训练预测 => 保存提交...原创 2022-04-08 13:20:03 · 558 阅读 · 0 评论 -
机器学习的【矩阵求导】基础
【参考:机器学习中的矩阵求导方法_哔哩哔哩_bilibili】课件链接:https://pan.baidu.com/s/1hSyVVLh1Z9mNy_0LlmJ_bw?pwd=99l9 提取码:99l9一维向量默认是列向量 ,但常用行向量的转置来表示 ,比如 A=[1,2]TA=[1,2]^TA=[1,2]T...原创 2022-04-01 19:07:14 · 900 阅读 · 0 评论 -
【机器学习】信用卡欺诈检测 (下采样、SMOTE过采样、集成学习、Pytorch)
【参考:机器学习项目实战之信用卡欺诈检测(零基础,附数据及详细python代码)_西南交大-Liu_z的博客-优快云博客】【参考:实战六:kaggle实战之信用卡欺诈检测_超级圈的博客-优快云博客】代码:https://gitee.com/myaijarvis/ai/blob/master/机器学习/Kaggle/信用卡欺诈检测.ipynb分析目的【参考:kaggle信用卡欺诈识别项目 - 知乎】【参考:信用卡欺诈检测 | Kaggle】利用大量数据,通过逻辑回归的算法,检验模型的效果,即模原创 2022-03-31 21:34:43 · 5779 阅读 · 3 评论 -
【机器学习】梯度下降法与线性回归
基础参考:机器学习训练营,梯度下降算法的设计与实现,讲师版_哔哩哔哩_bilibili求极小值参考:看动画,成为机器学习工程师,梯度下降算法的设计与实现_哔哩哔哩_bilibili# 计算x位置的梯度def gradient(x): return 2.0 * x - 4 # 函数f(x)=x^2-4x-5的梯度# 梯度下降的过程中,函数返回迭代完成后,f(x)取的最小值时的x值def gradient_descent(): x = 0.0 # 从位置0开始迭代原创 2021-12-21 20:36:44 · 786 阅读 · 0 评论 -
【机器学习】sklearn 笔记
学习方法不要死啃书,看不懂就先放弃,回过头再来看去网上找相关章节的文章,归类查看并做好笔记不要想着了解每个函数、参数的作用,不会不了解就去查资料即可,先上手跑起来1、机器学习算法的整体使用步骤如下:(1)从scikitlearn库中调用相应的机器学习算法模块;(2)输入相应的算法参数定义一个新的算法;(3)输入基础训练数据集利用scaler对其进行数据归一化处理(4)对于归一化的数据集进行机器学习算法的训练fit过程;(5)输入测试数据集对其结果进行预测predict;(6)将预.原创 2021-12-05 20:09:03 · 2653 阅读 · 1 评论 -
【机器学习】sklearn——线性回归
【参考:scikit-learn中文社区】学习原理,学习案例,学习API参数本文参考(从零开始)《机器学习的数学原理和算法实践》这篇文章也不错【参考:机器学习 | 算法笔记- 线性回归(Linear Regression) - eo_will - 博客园】【参考:公式里面的arg是什么意思?_一个做图像文本的深度学习人-优快云博客】术语MAE(mean square error) 均方误差 又称 残差原理基本形式f(x)=w1x1+w2x2+...+wdxd+bf(x)=w_1 x_1.原创 2022-03-07 20:02:36 · 1176 阅读 · 0 评论