- 博客(12)
- 收藏
- 关注
原创 【无标题】
使用ymal配置参数新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入config.yamltrain: 100test: 10oot: 0import yamlyaml_file = open(r’C:\User
2022-01-17 17:38:32
172
原创 案例2蒸汽量预测
内容太多就直接把想法写到了程序注释里了# Author:wxs# Date :2021/5/23 22:01import warningswarnings.filterwarnings("ignore")import matplotlib.pyplot as pltimport seaborn as sns# 模型import pandas as pdimport numpy as npfrom scipy import statsfrom sklearn.model_select
2021-05-23 22:20:17
177
原创 集成学习案例一 (幸福感预测)
ps: 由于代码比较多 自己的想法都在代码前后注释 ,审核的时候看下,不是直接粘贴的总体分为:1数据探索2数据预处理3.特征构造,根据实际含义各种排列组合 加减乘除(baseline作者真的有功夫,佩服)4.建模5.融合# Author:wxs# Date :2021/5/17 18:39import osimport timeimport pandas as pdimport numpy as npimport seaborn as snsfrom sklearn.linear
2021-05-17 20:15:38
297
原创 Stacking集成学习算法
与blending相比 使用了交叉验证,而且数据量更大,避免了浪费数据安装mlxtend包,这是个实现Stacking集成学习算法的库下面还用鸢尾花数据集做测试加载包,鸢尾花只选择了两列特征,相对比较简单from sklearn import datasetsiris = datasets.load_iris()X, y = iris.data[:, 1:3], iris.targetfrom sklearn.model_selection import cross_val_scorefr
2021-05-12 20:58:42
423
原创 集成学习task12
导入相关包import numpy as npimport pandas as pdimport matplotlib.pyplot as plt创建二分类数据集from sklearn import datasetsfrom sklearn.datasets import make_blobsfrom sklearn.model_selection import train_test_splitdata, target = make_blobs(n_samples=10000, ce
2021-05-10 16:32:23
101
原创 模型融合
模型融合:模型融合的目的是为了降低单个模型的随机性,提高预测结果的准确率,旨在把多个模型的结果和在一起:这里先写一下简单的加权融合前面的数据读取和预处理就不在写了,直接开始模型融合划分好训练集合测试集X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2)这里定义了三个模型:分别是随机森林,LGB和NN神经网络,(这里只是写了一下思路,所以模型都是简单的模型,参数都是默认的)def
2021-03-28 21:33:03
659
原创 模型调参
模型调参:常用的调参方法:1.手动调参数(根据参数的重要性)2.网格搜索3.贝叶斯优化1.建立模型后一次对learning_rate,max_depth等进行调节,看模型的评价指标的变化cv_scores = []for i, (train_index, valid_index) in enumerate(kf.split(X_train, y_train)): print('************************************ {} ***************
2021-03-25 22:36:05
531
原创 特征工程
特征工程导入包与读取数据部分import pandas as pdimport numpy as npimport lightgbm as lgbimport xgboost as xgbfrom catboost import CatBoostRegressorfrom sklearn.linear_model import SGDRegressor, LinearRegression, Ridgefrom sklearn.preprocessing import MinMaxScale
2021-03-22 19:56:57
87
原创 autoencoder
autoencoder demo pythorchimport torchimport torch.nn as nnfrom torch.autograd import Variableimport torch.optim as optimfrom torch.utils.data import Dataset, DataLoaderimport torch.nn.functional as Fclass Autoencoder(torch.nn.Module): def __i
2021-03-22 17:39:08
120
原创 pytorch 构造自己的数据集方法
pytorch 构造自己的数据集方法:[这个给我启发老哥的链接]:(https://blog.youkuaiyun.com/weixin_42320758/article/details/113930316)这个很重要,因为使用pytorch时我们构造自己的数据集要使用该方法,大部分课程都是直接调用的MNIST数据集,他们都是用该方法封装好的.自己课程学习复现的为:import pandas as pdfrom torch.utils.data import Datasetfrom torch.utils.
2021-03-18 16:41:54
339
原创 EDA
心电图心跳信号多分类预测 数据探索(EDA )数据为处理后的数据,不是原始数据主要做一些描述性统计,看是否有缺失值,以及正常的分布情况,可以通过查看分位数train =pd.read_csv(r"D:\Ziliao\untitled4\a天池\heart\train_new.csv")train.shapetrain.describe()# 结果如下 Unnamed: 0 id ... s_204 labelc
2021-03-18 16:30:35
133
原创 天池新手赛心跳信号分类预测
天新手赛心跳信号分类预测def reduce_mem_usage(df): start_mem = df.memory_usage().sum() / 1024 ** 2 print('Memory usage of dataframe is {:.2f} MB'.format(start_mem)) for col in df.columns: col_type = df[col].dtype if col_type != object:
2021-03-15 11:22:37
456
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人