- 博客(12)
- 问答 (1)
- 收藏
- 关注
原创 RMSE、MAPE、准确率、召回率、F1、ROC、AUC数据挖掘中的性能指标总结
RMSE(root mean square error)均方根误差单纯统计误差的值。 MAPE(mean absolute percentage error) 平均百分比误差存在一个和原始数据相比较的过程。 准确率(precision)P:P=TP/(TP+FP)TP(true positive) FP(false positive)P是代表预测为真...
2018-03-06 16:43:07
29261
5
原创 异或运算
异或是计算机中的逻辑运算用^表示,在异或运算时需要转换成二进制运算且:1 ^ 1 = 0; 1 ^ 0 = 1; 0 ^ 0 = 0; 0 ^ 1 = 1int a = 3; b = 4a ^ b = 7a => 011 ; b => 100 ; a ^ b = 011 ^ 100 = 111 => int 7运算规律 1、x ^ y = y ^ x2...
2018-01-06 16:11:19
1627
原创 装饰器的使用
类似于想要在函数在运行前打印函数名方便调试程序,这种在函数调用前运行的内容,可以称之为函数的装饰,而实现装饰的函数可以称之为装饰器。首先自己定义一个函数:def now(*args,**kw): print(args) print('2018-1-5') 想要now函数print之前打印函数名可以的做法: def decorator(fun): ...
2018-01-05 13:17:17
1095
原创 fun中*args和**kw的含义
*args和**kw都代表不确定的函数变量,即在函数调用时可以选择传入或者不传入参数,都不影响函数运行。其中*args将传入对象当成是元组对待;**kw将传入对象当成字典对待。例:def fun(*args): print(args)fun(1,2,3)(1,2,3)def fun(**kw): for k in kw: print(k...
2018-01-04 21:39:07
2472
原创 pandas.DataFrame.prod()
DataFrame中的prod()函数是返回不同维度上的乘积prod函数有几个参数axis(0 or 1)分别代表在纵轴和横轴上进行乘积运算skipna(Boolean)计算时是否忽略空值levelint or level name, default NoneIf the axis is a MultiIndex (hierarchical), count along a p...
2018-01-03 11:00:03
5584
原创 Principal component analysis(PCA)主成分分析
PCA是将原始数据X通过数学方法降维,得到产生该形式数据的内在原因。主要步骤为:1)求原始数据X的协方差矩阵S2)求S的最大特征值对应的K个特征向量并构成权重矩阵W3)将W与X内积得到降维数据Z代码如下:# -*- coding: utf-8 -*-"""Created on Sat Oct 7 20:21:05 2017@author: wjw"""impor
2017-10-08 19:07:57
547
原创 基于DNN的semi-supervised learning
半监督学习:就是通过部分有label的数据,学习得到其余没有label数据的label。本文用的方法是 low-density separation (低密度的边界分类)中 self-training 方法;low-density separation 是按照“非黑即白”的观念进行分类。在对已有label数据建立模型时,本文采用的是DNN。整体基本步骤如下:repeat:1)将已有la
2017-09-25 16:27:11
498
原创 连续数值属性的CART decision tree
划分数据集:Iris;数据形如: a b c d class0 5.1 3.5 1.4 0.2 Iris-setosa1 4.9 3.0 1.4 0.2 Iris-setosa2 4.7 3.2 1.3 0.2 Iris-setosa3 4.6 3.1 1
2017-09-22 15:36:57
912
原创 keras深度学习入门
目标:完成对Iris数据集分类Iris是4维数据,所以第一层的neuron的数目时4;定义两个hidden-layer,每层有10个neuron;因为要对Iris数据分成3类,所以最后一层的neuron数目为3,且activation函数为softmax,将输出结果normalized到0-1之间。重要函数:keras.utils.to_categorical(),将数据转换成one-
2017-09-16 19:21:32
346
原创 multi-class logestic regression的python实现
logestic 多分类问题原理:每一维上都进行回归,每一维上进行gradient descent不多说了贴代码:# -*- coding: utf-8 -*-"""Created on Sun Sep 10 20:47:58 2017@author: wjwlogestic regression 来分类就是通过已有data来估计数据的分布模型,然后将test数据
2017-09-15 11:50:15
771
原创 gradient descent 的python实现
从模拟数据集到曲线拟合# -*- coding: utf-8 -*-"""Created on Tue Sep 5 21:21:58 2017@author: wjw模拟产生数据集,然后再进行拟合"""def nomalization(X):#不归一化时梯度下降时数值太大,报错 maxX = max(X) minX = min(X) normaliz...
2017-09-07 20:57:12
3807
原创 二分K-means的python实现
前两天无意间看到”zouxy09“大牛的机器学习算法与Python实践之(六)二分k均值聚类讲解,我感觉很受启发啦,但是又看到下面的评论里说出了一些不足,然后就抱着试一试的心态去做了一下,所以数据还是用的”zouxy09“的,链接在下面贴出来了。下面放代码啦~#coding:utf-8#二分K-means算法import numpy as npimport randomimport m
2016-12-25 10:30:05
1429
4
空空如也
python中引用sklearn包报错
2017-01-06
TA创建的收藏夹 TA关注的收藏夹
TA关注的人