
ML
文章平均质量分 55
QxXyY
这个作者很懒,什么都没留下…
展开
-
2021-09-18
再生希尔伯特空间与核方法http://songcy.net/posts/story-of-basis-and-kernel-part-2/转载 2021-09-18 15:44:58 · 76 阅读 · 0 评论 -
环境配置2022.2.2
新电脑配置python环境1.安装anaconda首先安装anaconda,安装anaconda后无需再手动安装pythonanaconda安装过程中勾选将conda添加至path的选项,否则安装完需要手动添加环境变量anaconda对应python版本:conda与python版本对应表创建python环境conda create -n py3.7 python=3.7activate命令激活后使用python命令查看环境python版本conda下载源设置添加清华镜像:conda co原创 2022-02-03 01:20:31 · 1836 阅读 · 1 评论 -
性能评估指标
http://charleshm.github.io/2016/03/Model-Performance/转载 2021-11-09 16:32:06 · 147 阅读 · 0 评论 -
心跳信号分类预测(四)建模与调参
本次任务选择lightgbm进行建模调参。1.关于lightgbmLightGBM 由微软提出,主要用于解决 GDBT 在海量数据中遇到的问题,以便其可以更好更快地用于工业实践中。LightGBM及GDBT都是boosting的方法,即基模型的训练是有顺序的,每轮训练在前一轮训练的基础上进行。LightGBM针对XGboost在以下几个方面进行优化:1.单边梯度抽样算法;2.直方图算法;3.互斥特征捆绑算法;4.基于最大深度的 Leaf-wise 的垂直生长算法;5.类别特征最优分割;6原创 2021-03-26 02:51:11 · 847 阅读 · 0 评论 -
心跳信号分类预测(一)赛题理解及Baseline
心跳信号分类预测(一)比赛链接比赛链接赛题概况比赛要求参赛选手根据给定的数据集,建立模型,预测不同的心跳信号。赛题以预测心电图心跳信号类别为任务,数据集报名后可见并可下载,该该数据来自某平台心电图数据记录,总数据量超过20万,主要为1列心跳信号序列数据,其中每个样本的信号序列采样频次一致,长度相等。为了保证比赛的公平性,将会从中抽取10万条作为训练集,2万条作为测试集A,2万条作为测试集B,同时会对心跳信号类别(label)信息进行脱敏。数据概况train.csvid 为心跳信号分配的唯一标识原创 2021-03-17 01:09:37 · 3930 阅读 · 5 评论 -
心跳信号分类预测(二)数据分析
EDA(Exploratory Data Analysis)对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。加载分析所用的python库#coding:utf-8#导入warnings包,利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')import missingno as msnoimport panda原创 2021-03-20 02:35:17 · 1427 阅读 · 1 评论 -
线性回归、逻辑回归代码实现
生成样本点:import numpy as npimport matplotlib.pyplot as pltdef true_fun(X): return 1.5*X + 0.2np.random.seed(0)n_samples = 30X_train = np.sort(np.random.rand(n_samples)) y_train = (true_fun(X_train) + np.random.randn(n_samples) * 0.05).reshape(n_sam原创 2021-12-16 01:26:51 · 1834 阅读 · 0 评论 -
心跳信号分类预测(三)特征工程
学习目标学习时间序列数据的特征预处理方法学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用1.导入数据# 包导入import pandas as pdimport numpy as npimport tsfresh as tsffrom tsfresh import extract_features, select_featuresfrom tsfresh.utilities.dataframe_functions import impute# 数据读取原创 2021-03-23 02:44:20 · 1101 阅读 · 0 评论