自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 【无标题】

使用ymal配置参数新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入config.yamltrain: 100test: 10oot: 0import yamlyaml_file = open(r’C:\User

2022-01-17 17:38:32 172

原创 案例2蒸汽量预测

内容太多就直接把想法写到了程序注释里了# Author:wxs# Date :2021/5/23 22:01import warningswarnings.filterwarnings("ignore")import matplotlib.pyplot as pltimport seaborn as sns# 模型import pandas as pdimport numpy as npfrom scipy import statsfrom sklearn.model_select

2021-05-23 22:20:17 177

原创 集成学习案例一 (幸福感预测)

ps: 由于代码比较多 自己的想法都在代码前后注释 ,审核的时候看下,不是直接粘贴的总体分为:1数据探索2数据预处理3.特征构造,根据实际含义各种排列组合 加减乘除(baseline作者真的有功夫,佩服)4.建模5.融合# Author:wxs# Date :2021/5/17 18:39import osimport timeimport pandas as pdimport numpy as npimport seaborn as snsfrom sklearn.linear

2021-05-17 20:15:38 297

原创 Stacking集成学习算法

与blending相比 使用了交叉验证,而且数据量更大,避免了浪费数据安装mlxtend包,这是个实现Stacking集成学习算法的库下面还用鸢尾花数据集做测试加载包,鸢尾花只选择了两列特征,相对比较简单from sklearn import datasetsiris = datasets.load_iris()X, y = iris.data[:, 1:3], iris.targetfrom sklearn.model_selection import cross_val_scorefr

2021-05-12 20:58:42 423

原创 集成学习task12

导入相关包import numpy as npimport pandas as pdimport matplotlib.pyplot as plt创建二分类数据集from sklearn import datasetsfrom sklearn.datasets import make_blobsfrom sklearn.model_selection import train_test_splitdata, target = make_blobs(n_samples=10000, ce

2021-05-10 16:32:23 101

原创 模型融合

模型融合:模型融合的目的是为了降低单个模型的随机性,提高预测结果的准确率,旨在把多个模型的结果和在一起:这里先写一下简单的加权融合前面的数据读取和预处理就不在写了,直接开始模型融合划分好训练集合测试集X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2)这里定义了三个模型:分别是随机森林,LGB和NN神经网络,(这里只是写了一下思路,所以模型都是简单的模型,参数都是默认的)def

2021-03-28 21:33:03 659

原创 模型调参

模型调参:常用的调参方法:1.手动调参数(根据参数的重要性)2.网格搜索3.贝叶斯优化1.建立模型后一次对learning_rate,max_depth等进行调节,看模型的评价指标的变化cv_scores = []for i, (train_index, valid_index) in enumerate(kf.split(X_train, y_train)): print('************************************ {} ***************

2021-03-25 22:36:05 531

原创 特征工程

特征工程导入包与读取数据部分import pandas as pdimport numpy as npimport lightgbm as lgbimport xgboost as xgbfrom catboost import CatBoostRegressorfrom sklearn.linear_model import SGDRegressor, LinearRegression, Ridgefrom sklearn.preprocessing import MinMaxScale

2021-03-22 19:56:57 87

原创 autoencoder

autoencoder demo pythorchimport torchimport torch.nn as nnfrom torch.autograd import Variableimport torch.optim as optimfrom torch.utils.data import Dataset, DataLoaderimport torch.nn.functional as Fclass Autoencoder(torch.nn.Module): def __i

2021-03-22 17:39:08 120

原创 pytorch 构造自己的数据集方法

pytorch 构造自己的数据集方法:[这个给我启发老哥的链接]:(https://blog.youkuaiyun.com/weixin_42320758/article/details/113930316)这个很重要,因为使用pytorch时我们构造自己的数据集要使用该方法,大部分课程都是直接调用的MNIST数据集,他们都是用该方法封装好的.自己课程学习复现的为:import pandas as pdfrom torch.utils.data import Datasetfrom torch.utils.

2021-03-18 16:41:54 339

原创 EDA

心电图心跳信号多分类预测 数据探索(EDA )数据为处理后的数据,不是原始数据主要做一些描述性统计,看是否有缺失值,以及正常的分布情况,可以通过查看分位数train =pd.read_csv(r"D:\Ziliao\untitled4\a天池\heart\train_new.csv")train.shapetrain.describe()# 结果如下 Unnamed: 0 id ... s_204 labelc

2021-03-18 16:30:35 133

原创 天池新手赛心跳信号分类预测

天新手赛心跳信号分类预测def reduce_mem_usage(df): start_mem = df.memory_usage().sum() / 1024 ** 2 print('Memory usage of dataframe is {:.2f} MB'.format(start_mem)) for col in df.columns: col_type = df[col].dtype if col_type != object:

2021-03-15 11:22:37 456 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除