
机器学习系列
两把伞
你要的,时间都会给你
展开
-
jena_climate_2009_2016耶拿天气数据集--百度云
感谢github上分享。链接:https://pan.baidu.com/s/1eP2Q79r3YADzPOCjIOBKbw提取码:pgqh不需解压密码原创 2020-02-20 13:17:49 · 3450 阅读 · 14 评论 -
`set_session` is not available when using TensorFlow 2.0.
若是遇到如题错误,则将keras.backend.tensorflow_backend.set_session(tf.compat.v1.Session(config=config))改为tf.compat.v1.keras.backend.set_session(tf.compat.v1.Session(config=config))即可参考来源:https://www.te...原创 2020-02-15 15:56:09 · 19436 阅读 · 7 评论 -
XGBoost WARNING: /workspace/src/objective/regression_obj.cu:152: reg:linear is now deprecated
遇到这个warning这的是看着烦,感谢前辈:https://github.com/dmlc/xgboost/issues/4599加上这个参数: objective =‘reg:squarederror’ 即可转载 2019-11-13 11:46:32 · 3423 阅读 · 6 评论 -
混淆矩阵和ROC的个人理解
以下都是个人得到的认识,不一定正确!混淆矩阵肯定类别否定类别阳性判断真阳性(TP)假阳性(FP)阴性判断假阴性(FN)真阴性(TN)这是我自己对上面混淆矩阵的理解:真阳性:真:表示我预测的结果是阳性的,而实际结果也是阳性的,所以我预测对了,从而为真。阳性 : 表示我预测的结果为阳性。从而简称为真阳性假阳性:假:表示我预测的结果是阳性...原创 2019-10-25 16:36:39 · 1375 阅读 · 0 评论 -
非均衡样本的简单认识
非均衡样本的定义在分类问题中,每种类别的出现概率未必均衡。比如 : 信用风险:正常用户远多于逾期/违约用户。非平衡样本导致的问题:降低少类样本的灵敏性。非均衡样本的解决办法:1 过采样考虑对小类下的样本(不足1为甚至更少)进行过采样,即添加部分样本的副本;过采样的缺点是导致过拟合。欠采样考虑对大类下的样本(超过1万、十万甚至更多)进行欠采样,即删除部分样本;欠采样导致...原创 2019-10-24 17:06:41 · 751 阅读 · 0 评论 -
多重共线性的个人理解
多重共线性(multicolinearity)是指线性回归模型钟的自变量之间由于存在高度相关系数而使模型的权重参数估计失真或者难以估计准确性的一种特性,多重是指一个自变量可能与多个其他自变量之间存在相关关系。多重共线性会放大随机误差或者异常值的影响,导致两次计算结果出现很大的误差,共线性越想这种放大作用越强。多重共线性的问题:这个问题可以类比模型集成:我们希望基模型效果要好,且存在差异性,这样...原创 2019-10-21 16:37:22 · 4743 阅读 · 0 评论 -
Titanic data deal
%matplotlib inlineimport numpy as npimport pandas as pdimport re as retrain = pd.read_csv("./data/train.csv",header = 0,dtype={'Age':np.float64})test = pd.read_csv("./data/test.csv",header = 0,d...转载 2019-10-17 23:54:29 · 214 阅读 · 0 评论 -
神经网络中权重共享的理解
所谓的权重共享就是说,输入一张图片,这张图片的用一个filter进行卷积操作的时候,图片中的每一个位置都被同一个filter进行卷积,所以权重是一样的,也就是共享。这个是在一个卷积层操作的时候的权重共享,另一个卷积层是利用另一个filter对图片进行扫描,实现权重共享的。...原创 2019-10-12 09:05:46 · 9921 阅读 · 0 评论 -
sklearn.model_selection.train_test_split方法初识
sklearn.model_selection.train_test_split将数组或矩阵切分成随机训练和测试子集。参数列表:1 *arrays : sequence of indexables with same length / shape[0]行数(样本数)/shape[0]取值相同的2 test_size : float,int or None,optional(def...原创 2019-09-16 16:05:57 · 227 阅读 · 0 评论 -
朴素贝叶斯的推导
朴素贝叶斯=朴素+贝叶斯原理。朴素:navie,天真,天真的认为特征独立同分布(但现实是复杂的,一般都不是独立的)贝叶斯原理:p(y∣x)=p(x,y)p(x)p(y|x)=\frac{p(x,y)}{p(x)}p(y∣x)=p(x)p(x,y)朴素贝叶斯是生成式模型,用于做分类的,它是通过argmax p(y|x)来生成类别。那么argmax p(y|x)如何来的呢?如何使得后验概率p...原创 2019-09-09 21:24:20 · 916 阅读 · 0 评论