「已注销」-优快云博客

原创 AttributeError: ‘RandomUnderSampler‘ object has no attribute ‘fit_sample‘

python用RandomUnderSampler库下采样的时候，报的错原代码：from collections import Counterfrom imblearn.under_sampling import RandomUnderSamplertrain = pd.read_csv('./data/0504_ftr.csv')test = pd.read_csv('./data/0504_fte.csv')y = train['label']-1del train['labe

2021-05-06 19:54:11 4532 2

原创（学习）读官方文档：from sklearn.ensemble import AdaBoostClassifier

目标：使用AdaBoostClassifier实现多分类解决方法：（1）网上搜索案例（2）查看官方文档 or 命令行使用help()这次想用一下help()，突破一下。首先，python命令行输入help()help()然后，出现如下，输入sklearn.ensemblePACKAGE CONTENTS(包的内容) _bagging _base _forest _gb _gb_losses _gradient_boost...

2021-05-06 11:04:04 1688 1

原创（学习）python库StratifiedKFold交叉验证的使用

基本用法： >>> import numpy as np >>> from sklearn.model_selection import StratifiedKFold >>> X = np.array([[1, 2], [3, 4], [1, 2], [3, 4]]) >>> y = np.array([0, 0, 1, 1]) >>> skf = StratifiedKF

2021-05-05 18:06:02 681

原创（自用）链接收藏

python实现各种机器学习库：Python使用sklearn库实现的各种分类算法简单应用小结_python_脚本之家 (jb51.net)

2021-05-05 17:43:50 169

原创（傻瓜教程）Stacking&Blending——鸢尾花数据集为例

1、Stacking做一个分类模型，先确定输入、输出、处理。输入：训练集：鸢尾花数据集(150行，4个属性，1列标签，标签为1、2、3)测试集：假设有20行测试集（与150行无关，无真实值标签，4个属性）输出：预测的标签处理：(1)数据集的处理：5折交叉验证，每折30行（2）模型选择：第一层模型选择xgboost、gbdt、rf；第二层模型选择LR（3）stacking：首先，第一层：xgboost对tr2tr3tr4 tr5训练，对tr1测试，得到一个...

2021-05-05 13:54:59 654

原创（笔记）pandas学习（持续更新......）

（1）打印某列的唯一值真是能偷懒，hhhh正经写法：print(train['label'].unique())

2021-05-03 22:26:17 133

原创 CUDA error 35: CUDA driver version is insufficient for CUDA runtime version

MobaXterm服务器端服务器端运行报错：按照网上的方法依次检查服务器型号自然是一点看不懂。但最后一个false明显有问题。尝试解决。（解决CUDA driver version is insufficient for CUDA runtime version - PilgrimHui - 博客园 (cnblogs.com)）我的身份验证不能通过。啊，这。。。。。本地pycharm把文件下载到本地，在本地pycharm中运行：(小2G的数据)运行报错：

2021-05-03 20:28:55 6871

原创（笔记）模型融合&集成学习

Reference links are as follows:模型融合方法总结 - 简书 (jianshu.com)为什么说模型融合会提升性能？（回归问题也一样）模型融合怎么更有效？具体模型融合的方法？基础：分类：link：https://gitmind.cn/app/doc/17a1626348我目前的理解是集成学习和模型融合是一个...

2021-05-03 20:12:55 191

原创 (笔记)宏平均和微平均

目录应用场景：多分类计算公式：例子：例（1）宏平均：微平均：例（2）：宏平均：微平均：例（3）：区别+更详细的应用场景：结论：应用场景：多分类计算公式：（转自：谈谈评价指标中的宏平均和微平均_chenpe32cp的博客-优快云博客）两句话就是：宏平均先在每个类别上计算P、R、F值，再取平均，我猜它之所以叫宏平均就是因为它用到了÷n；（自己的猜测，帮助理解）微平均看总体的P、R，然后计算F；例子：例（1）（链..

2021-04-29 00:10:12 2383 1

原创 C语言IO操作，

题转学校题目题目背景输入格式题目描述有多组输入数据输入格式给出多组a,b,输出a+b的值输出格式有多组输出，对应着每组输入，每组输出占一行。输入输出样例输入 #1复制1 2 3 4 2 3输出 #1复制3 7 5解题：这个题实际上有点鸡肋，可以理解为一边输入一边输出。#include<iostream>usin...

2021-04-28 12:14:41 108

原创 ValueError: Target scores need to be probabilities for multiclass roc_auc, i.e. they should sum up t

发现了一个很有趣的错误，标题计算多分类的ROC值，这个错误肯定不难。值的错误是因为ROC根据概率值，去判断测试集预测的是正例还是负例，所以在进行预测得时候，要预测概率，加个_proba我是在源代码发现这个错误的。定位到python内部的定义，人家官方给了例子，一看就知道哪里错了。...

2021-04-28 01:50:16 3195

原创 python+pycharm+pyspark+windows搭建spark环境+各种踩坑

python+pycharm+pyspark+windows搭建spark环境+各种踩坑 - 知乎 (zhihu.com)

2021-04-28 01:14:48 238

原创 numpy.AxisError: axis 1 is out of bounds for array of dimension 1

最讨厌这种看起来问题明明不大，但死活找不到对错的error经过仔细查看，有一个是dataframe类型，有一个是ndarray类型，我检查过了，长度一致，唯一的可能是库的版本问题，我也不知道什么库的版本可是，把ndarray类型的转化为dataframe类型的。numpy有点事多。...

2021-04-28 01:10:39 4474 2

原创 Py4JJavaError: An error occurred while calling o149.trainALSModel. : org.apache.spark.SparkException

2021-04-23 19:16:16 1073

原创机器学习周志华决策树预剪枝、后剪枝

2020-03-28 21:18:32 756 1

原创安装Graphviz + N次卸载重装anaconda+anaconda下安装Graphviz

1、安装graphviz(N次重装Anaconda见2)最近老师布置了一个决策树的作业，需要Graphviz库，经过网上多方借鉴，主要的方法包含两种：一种直接用python的底层安装，另一种为借助编辑器快捷安装先安装Graphviz，配环境变量，再安装pyGraphviz；(此种方法可在搜索栏键入：“python 安装Graphviz”)这里提供可能需要的文件。见下方第2个小点点当然了...

2020-03-04 13:06:22 3283

原创 [DFS]湖计算问题

经过反复观看以及啊哈算法的讲解，终于能看懂了dfs并自己能大致实现数组越界问题#include<iostream>using namespace std;int a[8][2]={{-1,-1},{-1,0},{-1,1},{0,-1},{0,1},{1,-1},{1,0},{1,1}};int m,n;char land[105][105];bool vis[105...

2019-08-18 10:30:17 225

原创 [啊哈算法]链表

今天算是对链表和指针有了一个新的感悟。以前总是朦胧的概念，特别对于malloc()函数，几乎是死记硬背，现在认识的清晰了一点。感触如下：对于链表的使用正如数组的使用要有常用的遍历符号：t，数组中的遍历符号都是i,j；数组的遍历结束标志为数组长度，链表的遍历结束为t==NULL如果还是有点蒙，请看如下代码：数组：//数组for(int i=0;i<n;i++){ .........

2019-08-16 17:27:40 229

原创 [啊哈算法]纸牌游戏--小猫钓鱼

利用STL中队列与栈#include<iostream>#include<queue>#include<stack>#include<cstdio>using namespace std;int main(){ queue<int> q1,q2; stack<int> s,s1; int book[10]={...

2019-08-16 14:55:52 597

原创 [啊哈算法]利用C++队列：解密QQ号

#include<iostream>#include<queue>using namespace std;int main(){ queue<int> q; int n,t,t1,i; cin>>n; int a[n];//存QQ号 for(i=0;i<n;i++){ cin>>t; q.push(t);/...

2019-08-06 10:10:04 1215

转载括号匹配问题栈的思想

- 出现左括弧则进栈　　　　- 出现右括弧则首先检测栈是否为空，　若栈空则表明此右括弧多余，表达式不匹配。　否则和栈顶数据比较，若匹配则栈顶出栈。　否则表明表达式不匹配；最后若栈空，则表明匹配成功；否则表明不匹配。转载：https://www.cnblogs.com/rrttp/p/7913091.html...

2019-08-06 10:09:44 522

原创 [啊哈算法]栈解决回文比较

#include<stack>#include<string>#include<iostream>using namespace std;//回文的判断可以用栈或者直接字符串的比较也很方便！ int main(){ string str; stack<char> s; cin>>str; int len=str.leng...

2019-08-06 10:09:18 147

转载欧拉筛求素数序列

#include<iostream>#include<string.h>// memset头文件 using namespace std; int prime[2000000];//存储素数bool vis[2000000];//记录每个元素的状态 int size=0;//素数个数 int n;//n以内的long long int sum=0;//存储和...

2019-08-06 10:07:52 117

qq_42008588的博客