- 博客(10)
- 收藏
- 关注
原创 Python字符串之encode & decode
1. Encode将str类型编码成bytes类型:>>>strs = '中文English'>>>strs.encode('utf-8')b'\xe4\xb8\xad\xe6\x96\x87English'>>>strs.encode('gb2312') ...
2019-05-13 16:30:25
303
原创 正态分布、t分布、卡方分布、F分布的关系与差异
要理解这些分布,要从基础的正态分布开始。下面是维基百科对正态分布的介绍:正态分布(英语:normal distribution)又名高斯分布(英语:Gaussian distribution),是一个非常常见的连续概率分布。正态分布在统计学上十分重要,经常用在自然和社会科学来代表一个不明的随机变量。若随机变量 X服从一个位置参数为
2019-04-25 11:12:08
105472
原创 F检验的应用
对于正态总体来说,两个总体的方差比较可以用F-分布来检验:两个独立样本分别来自正态总体1(σ12)和正态总体来2(σ22), 其样本方差分别为S12 和S22。若σ12=σ22,则S12S22{\frac{S_1^2}{S_2^2}}S22S12的抽样分布服从F分布,分子自由度为n1-1, 分母自由度为n2-1 。F的临界值取决于分子自由度为n1-1, 分母自由度为n2-1 和
2019-04-25 11:05:15
8324
原创 秒懂np.nonzero, np.argwhere, np.where
习惯用np.where,乍看到np.argwhere时没清楚干嘛又多个这玩意儿,干脆理一下。先创建样本数据如下:np.nonzero得到数据中非零值的索引数组,如果输入数据为list,则返回一个array,若为两维及以上数据,返回相应数量的array。np.argwhere如果仅输入数据,未设置条件,则相当于是np.nonzero的转置,即np.transpose(np.non...
2019-04-23 12:12:22
4030
原创 Mac 设置Virtualbox虚拟机Ubuntu14.04与主机互ping并联网
其实之前设置过一次,因手贱升级了Ubuntu到16.04导致无法登录虚拟机了,具体问题有机会再补充,避免再有人掉坑。。。重装回了Ubuntu14.04, 按先前理解的,主要是设置NAT和桥接网络让虚拟机与主机互ping且联网,但这次却老是不成功,懊恼不已!遂在网上又找了一通设置的方法,七七八八整很多,浪费不少时间,所以决定要整理好供参考。其实真很简单,大致分为三步:1. 设置NAT网络NA...
2019-04-18 15:45:37
856
原创 Softmax Regression损失函数的求导
softmax regression 代价函数: J(θ)=−1m[∑i=1m∑j=1kI{y(i)=j}logeθjTX(i)∑l=1keθlTX(i)]J(\theta) = -\frac{1}{m}\left[\sum_{i=1}^{m}\sum_{j=1}^{k}I\{y^{(i)}=j\}log \frac{e^{{\theta_j^T}{X^{(i)}}}}{\sum_{l=1}...
2019-03-31 17:09:13
824
原创 Lightgbm运行 OMP: Error #15: Initializing libomp.dylib, but found libiomp5.dylib already initialize
运行lightgbm 2.2.3时出现如下错误:OMP: Error #15: Initializing libomp.dylib, but found libiomp5.dylib already initialize下面有一段解释:OMP: Hint This means that multiple copies of the OpenMP runtime have been linke...
2019-03-26 14:54:35
2184
原创 最通俗易懂的p value讲解
什么是p value?这个问题,曾一度让我怀疑我根本都没有学懂知识,只是像规则一样记住然后胡乱使用而已。此番记录就当再次考验我是否真正理解到p value的含义。p value,代表在原假设条件下,实验事件可能发生的概率。举例说明:抛一枚硬币,正面朝上和反面朝上的概率是一样的,各50%,但这是有前提条件的,即硬币是均匀的(原假设),才能保证正反面出现的概率相同。现在将该硬币抛掷5次,那么在原假...
2019-03-24 09:45:45
36986
1
原创 决策树(二):CART回归树与Python代码
上一篇介绍了决策树的基本概念,特征划分标准及ID3、C4.5和CART分类树的算法,本文着重对CART回归树的内容进行补充。本文概览:首先介绍CART回归树的算法,然后是创建CART回归树的主要步骤,最后是实现该过程的Python代码。一、CART回归树算法CART回归树处理的是回归问题,数据集的标签不再是离散的类别值,而是一系列的连续值的集合。CART回归树不同于线性回归模型,不是通过...
2019-03-13 20:43:15
3325
原创 决策树:ID3、C4.5、CART算法与Python实现
一、决策树的基本概念决策树(Decision Tree)算法是一类常用的机器学习算法,在分类问题中,决策树算法通过样本中某一些属性的值,将样本划分到不同的类别中。决策树跟人在做决策的思考方式很想像,先考虑重点选项,不符合则可最优先做出决策。长得帅不帅才华横溢会认字教练级小白热爱早鸭子相亲对象有才吗?不去喜欢羽毛球吗?不去去喜欢游泳吗?去不去1. 划分标准在决定是否去见相亲对象时,该女提出...
2019-03-11 17:03:04
1554
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人