- 博客(6)
- 收藏
- 关注
原创 LightGBM
参考文章https://blog.youkuaiyun.com/qq_24519677/article/details/82811215视频讲解https://v.qq.com/x/page/k0362z6lqix.html
2020-02-14 20:59:57
210
原创 关于机器学习简要知识点
对于机器学习中特征工程的理解 参考文章:http://blog.itpub.net/29829936/viewspace-2648602/对于模型的理解引用自一篇博客https://www.cnblogs.com/bjwu/p/8970821.htmlFeatures:numeric, categorical, ordinal, datetime, coordinate, t...
2020-02-10 18:40:48
209
原创 关于R中p值的理解
进行线性回归lm后执行summary函数之后,会有Coefficients:Estimate Std. Error t value Pr(>|t|) 这样的值出现,其中P值我是这样理解的P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。这样定义原假设,我们希望成立实现的研究假...
2018-06-13 16:33:01
23014
原创 R中常用英文词汇
Coefficients 系数Intercept 截距Residuals 残差1Q是第1百分位数,就是集合中,处于第25%位置的数,同理,3Q就是第3百分位,就是处于75%位置的数。里面的2Q就是median ,0%=min 100%=maxStd. Error 估计系数的标准差...
2018-06-07 14:40:05
2492
转载 R中常用统计指标含义
1、均值mean()2、方差:表示数据集中数据点的离散程度3、标准差表示的也是数据点的离散程度,与方差相比,使用标准差来表示数据点的离散程度有3个好处:表示离散程度的数字与样本数据点的数量级一致,更适合对数据样本形成感性认知。依然以上述10个点的CPU使用率数据为例,其方差约为41,而标准差则为6.4;两者相比较,标准差更适合人理解。表示离散程度的数字单位与样本数据的单位一致,更方便做后续的分析运...
2018-06-06 19:39:37
4111
原创 常用Hive语法及函数
hive使用一、joinleft join=left outer join ----返回左表所有的行,没有值的列为nulljoin=inner join ----返回匹配的行full join 返回左右表所有行二、havinghaving---对由sum或其它集合函数运算结果的输出进行限制eg:select user_id, sum(amount)/100 as amount from a ...
2018-04-12 20:12:44
479
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人