
机器学习
文章平均质量分 92
机器学习经历,与君共勉!
chaoql
长安大学软件工程专业硕士研究生在读,曾获蓝桥杯全国三等奖、互联网+全国三等奖等奖项,授权发明专利一篇,目前专注领域为:大模型应用、代码生成、大数据。欢迎交流!
展开
-
【强化学习】Q-learning原理及实现
Q-learning算法实际上相当简单,仅仅维护一个Q值表即可,表的维数为(所有状态S,所有动作A),表的内容称为Q值,体现该状态下采取当前动作的未来奖励期望。智能体每次选择动作时都会查询Q值表在当前状态下采取何种动作得到的未来奖励可能最多,当然也会添加一些随机性,使智能体可能选择别的可能当前认为未来奖励并不多的动作,以便跳出局部最优解,尽量得到全局最优解。原创 2023-12-04 00:23:40 · 2271 阅读 · 0 评论 -
【机器学习】Optuna机器学习模型调参(LightGBM、XGBoost)
文章目录1. optuna简介2. LGBM和XGBoost调参汇总2.1 LGBM2.1.1 定义Objective2.1.2 调参try2.1.3 绘图2.1.4 最佳参数2.2 XGBOOST2.2.1 定义Objectove2.2.2 调参try2.2.3 绘图2.2.4 最佳参数1. optuna简介在Kaggle比赛的过程中我发现了一个问题(大家的Kernel模型中包含了众多c超参数设置,但是这些参数是如何设置的呢?),并在Discussion中提出了我的问题,并得到了众多大佬的回答,如下:原创 2021-02-12 13:45:00 · 13684 阅读 · 23 评论 -
【机器学习】线性回归实现与应用
文章目录前置知识一元线性回归Step1 导入数据Step2 一元函数代码实现Step3 平方损失函数代码实现Step4 最小二乘法代码实现Step4.1 代数方式实现Step4.2 矩阵方式实现Step5 计算参数和平方损失值Step5.1 使用代数最小二乘函数实现Step5.2 使用矩阵最小二乘函数实现线性回归scikit_learn实现线性回归预测实战导入数据查看数据划分训练集和测试集构建和训练模型预测预测结果分析绝对误差函数均方误差函数结果分析前置知识【机器学习】最小二乘法(代数&矩阵推导原创 2020-09-05 21:15:16 · 1256 阅读 · 0 评论 -
【机器学习】逻辑回归实现与应用
文章目录介绍Sigmoid分布函数逻辑回归模型对数损失函数介绍逻辑回归(Logistic Regression),又叫逻辑斯蒂回归,是机器学习中一种十分基础的分类方法,由于算法简单而高效,在实际场景中得到了广泛的应用。本次实验中,我们将探索逻辑回归的原理及算法实现,并使用 scikit-learn 构建逻辑回归分类预测模型。Sigmoid分布函数因为今天要解决的是一个二分类问题,所以先介绍此函数f(z)=11+e−zf(z)=\frac{1}{1+e^{-z}}f(z)=1+e−z1p原创 2020-09-17 18:07:13 · 434 阅读 · 0 评论 -
【机器学习】K-近邻算法实现与应用(KNN)
文章目录距离度量曼哈顿距离欧氏距离最近邻算法K-近邻算法算法实现决策规则KNN算法实现测试数据丁香花分类加载数据集训练测试数据划分训练模型模型预测准确率计算K 值选择距离度量曼哈顿距离曼哈顿距离又称马氏距离,是计算距离最简单的方式之一。公式如下:dman=∑i=1N∣Xi−Yi∣d_{man}=\sum_{i=1}^{N}\left | X_{i}-Y_{i} \right | dman=i=1∑N∣Xi−Yi∣其中:XXX, YYY:两个数据点NNN:每个数据中有 NNN 个特征原创 2020-09-21 23:42:56 · 1658 阅读 · 0 评论 -
【机器学习】多项式回归
文章目录多项式回归介绍多项式回归基础实现二次多项式拟合实现N次多项式拟合多项式回归介绍前面我们拟合直线用到了线性回归,而非线性回归中,则需要建立因变量和自变量之间的非线性关系。从直观上讲,也就是拟合的直线变成了「曲线」。多项式回归基础导入数据x = [4, 8, 12, 25, 32, 43, 58, 63, 69, 79]y = [20, 33, 50, 56, 42, 31, 33, 46, 65, 75]实现二次多项式拟合y(x,w)=w0+w1x+w2x2+...+wmxm=原创 2020-09-07 16:19:15 · 1874 阅读 · 0 评论 -
机器学习概览及常见算法
AI算法学习笔记(1)有监督学习算法分类算法(离散数据)NB(朴素贝叶斯)DT(决策树):C45、CARTSVM(支持向量机)神经网络算法KNN(K最邻近)…回归预测(连续数据)线性回归逻辑回归岭回归拉索回归…常用评估指标精确率:预测结果与实际结果的比例;召回率:预测结果中某类结果的正确覆盖率;F1-Score:统计量,综合评估分类模型, 取值0-1之...原创 2020-03-28 16:04:05 · 293 阅读 · 0 评论 -
【kaggle-Top方案解析】房价预测数据探索(Comprehensive data exploration with Python by Pedro Marcelino)
本篇博客主要解读Comprehensive data exploration with Python by Pedro Marcelino数据处理方案文章目录0. 导入库1. 一些关于特征的思考2. 分析`SalePrice`以及与其相关单变量的关系2.1 分析`SalePrice`特征2.2 分析与相关单变量之间的关系2.2.1 分析数值型特征2.2.1.1 探究与`GrLivArea`之间的关系2.2.1.2 探究与`TotalBsmtSF`之间的关系2.2.2 分析类别型数据2.2.2.1 探究与`原创 2021-01-11 00:24:14 · 1263 阅读 · 4 评论 -
【机器学习实战】线性回归之北京市住房价格预测
文章目录数据集读取与划分数据集读取数据集划分模型训练及预测模型评价数据集读取与划分数据集读取import pandas as pd### 代码开始 ### (≈ 2 行代码)df=pd.read_csv("https://labfile.oss.aliyuncs.com/courses/1081/challenge-1-beijing.csv")df.head()### 代码结束 ###数据集划分features = df[['公交','写字楼','医院','商场','地铁','学校'原创 2020-09-05 21:41:39 · 883 阅读 · 0 评论 -
【Kaggle_Top方案解析】房价预测模型集成(Stacked Regressions : Top 4% on LeaderBoard by Serigne)
本篇博客主要解读Stacked Regressions : Top 4% on LeaderBoard by Serigne预测模型搭建方案文章目录1.模型总图2. Modelling2.1 Import librairies2.2 Define a cross validation strategy(定义交叉验证策略)2.3 Base models2.3.1 LASSO Regression2.3.2 Elastic Net Regression2.3.3 Kernel Ridge Regression原创 2021-01-14 22:37:21 · 824 阅读 · 0 评论 -
NumPy相关知识点汇总
头文件import numpy as npndarray的属性ndarray就是NumPy最具特色的一点,被称为N维数组对象,其实就是一个N维数组,下面先随便定义一个array,说说他的相关属性吧。import numpy as npscore=np.array([[7, 37, 81, 90, 45], [43, 26, 29, 27, 77], [4...原创 2020-03-25 21:42:51 · 376 阅读 · 0 评论 -
Matplotlib数据二维绘图实践
通过 Matplotlib 绘制出下图这副图像Codefrom matplotlib import pyplot as pltimport numpy as np#尺寸_figsize,分辨率_dpiplt.figure(figsize=(8, 5), dpi=80)axes = plt.subplot()#顶部和右侧边框设为隐藏axes.spines['top'].set_color('none')axes.spines['right'].set_color('none')#设置xy原创 2020-09-03 23:29:22 · 420 阅读 · 0 评论 -
【机器学习】岭回归和 LASSO 回归实现
文章目录普通最小二乘法的缺陷岭回归推导岭回归拟合普通最小二乘法的缺陷普通最小二乘法带来的局限性,导致许多时候都不能直接使用其进行线性回归拟合。特别是以下两种情况:数据集的列(特征)数量 > 数据量(行数量),即XXX不是列满秩。数据集列(特征)数据之间存在较强的线性相关性,即模型容易出现过拟合。岭回归推导为了解决上述两种情况中出现的问题,岭回归(Ridge Regression)应运而生。岭回归可以被看作为一种改良后的最小二乘估计法,它通过向损失函数中添加L2L2L2正则项(2-范数)原创 2020-09-09 19:03:14 · 748 阅读 · 0 评论 -
【机器学习】回归方法综合应用练习
文章目录一元线性回归模型加载数据集计算拟合参数拟合结果绘图多元线性回归模型计算拟合参数模型检验一元线性回归模型使用 SciPy 提供的普通最小二乘法分别计算 3 个特征与目标之间的一元线性回归模型拟合参数。加载数据集import pandas as pddata = pd.read_csv( 'http://labfile.oss.aliyuncs.com/courses/1211/Advertising.csv', index_col=0)data.head()数据集包含 4 列原创 2020-09-09 21:24:18 · 495 阅读 · 0 评论 -
【机器学习】最小二乘法(代数&矩阵推导)
文章目录最小二乘法代数求解step1:f=∑i=1n(yi−(w0+w1xi))2f=\sum_{i=1}^{n}(y_{i}-(w_0+w_1x_i))^2f=∑i=1n(yi−(w0+w1xi))2为平方损失函数;step2:分别对该函数的w0w_0w0和w1w_1w1求偏导;step3:分别令偏导为零;矩阵推导step1:函数式转化为矩阵形式;step2:矩阵对系数WWW求偏导;step3:令偏导为0;最小二乘法代数求解step1:f=∑i=1n(yi−(w0+w1xi))2f=\原创 2020-09-05 14:58:09 · 5516 阅读 · 4 评论 -
【Kaggle】Titanic: Machine Learning from Disaster
注:记录自己的第一次Kaggle文章目录ResultCode数据预览数据导入数据查看数据清洗删除多余特征缺失值填充数据挖掘家庭总人数身份标识年龄分级票价分级数据准备数据编码训练特征选择训练集测试集模型训练预测ResultCode数据预览数据导入# This Python 3 environment comes with many helpful analytics libraries installed# It is defined by the kaggle/python Docker i原创 2020-11-06 22:26:48 · 458 阅读 · 2 评论 -
【机器学习】梯度下降法求解线性回归参数
梯度下降法求解线性回归参数对于一元线性函数:y(x,w)=w0+w1xy ( x , w ) = w _ { 0 } + w _ { 1 } xy(x,w)=w0+w1x定义其平方损失函数为:f=∑i=1n(yi−(w0+w1xi))2f = \sum _ { i = 1 } ^ { n } \left( y _ { i } - \left( w _ { 0 } + w _ { 1 } x _ { i } \right) \right) ^ { 2 }f=i=1∑n(yi−(w0+原创 2020-09-16 10:46:32 · 1060 阅读 · 0 评论 -
Numpy百题大冲关(基础部分)
文章目录介绍基础部分1. 导入 NumPy:2. 查看 NumPy 版本信息:创建数组3. 通过列表创建一维数组:4. 通过列表创建二维数组:5. 创建全为 0 的二维数组:6. 创建全为 1 的三维数组:7. 创建一维等差数组:8. 创建二维等差数组:9. 创建单位矩阵(二维数组):10. 创建等间隔一维数组:11. 创建二维随机数组:12. 创建二维随机整数数组(数值小于 5):13. 依据自定义函数创建数组:数组运算14. 一维数组加法运算:15. 一维数组减法运算:16. 一维数组乘法运算:17.原创 2020-08-27 17:07:48 · 725 阅读 · 0 评论 -
【数据分析】相关性矩阵可视化(热力图heatmap)
文章目录数据概览相关性矩阵获取数据可视化数据概览# 以波士顿房价数据为例import pandas as pdtrain=pd.read_csv('/kaggle/input/house-prices-advanced-regression-techniques/train.csv')train.head<bound method NDFrame.head of Id MSSubClass MSZoning LotFrontage LotArea Street Al原创 2020-11-04 13:36:17 · 10771 阅读 · 3 评论 -
Matplotlib绘图函数应用总结
Matplotlib三层结构容器层画板层画布层plt.figure(figsize=(20, 8), dpi=80)绘图区辅助显示层x,y刻度plt.x/yticks()描述信息plt.x.ylabel()标题plt.title()图例plt.legend()网格plt.grid()图像层折线图plt.plot()散点图plt.scatter()柱状图p...原创 2020-03-24 11:11:25 · 727 阅读 · 0 评论