
DM
数据挖掘
BruceD_
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Scipy计算皮尔逊相关系数用法以及p-value和置信度的原理及区别
使用scipy计算皮尔逊相关系数时会返回相关系数和p-value两个值,刚开始把p-value和置信度当做了一回事,后来经过查阅资料之后才了解到并不是那样,现记录下来供自己备忘和有需要的同学参考:API用法scipy.stats.pearsonr(x, y)皮尔逊相关系数和p值用于测试非相关性。皮尔逊相关系数测量两个数据集之间的线性关系。 p值的计算依赖于每个数据集均呈正态分布的假设。与其他相关系数一样,该皮尔逊相关系数取值在-1和+1之间,为0时表示没有相关性。 -1或+1的相关性表示存在明确的线原创 2020-10-12 11:33:38 · 24318 阅读 · 0 评论 -
如何理解假设检验、P值?
本文转载自微信公众号:马同学高等数学讲概率、论统计,肯定要从抛硬币说起啊,这才是正确打开姿势嘛。1 什么是假设检验?你说你的硬币是公平的,也就是“花”和“字”出现的概率是差不多的。然后,你想和我打赌,作为一个资深的理智赌徒,我怎能听信你的一面之词,我提出要检查下你的硬币到底是不是公平的,万一是两面“花”怎么办?电影里面不是经常出现这样的桥段?你神色紧张,死活不让我检查,后来我们提出了折衷的方案,抛几次硬币,看看结果是不是公平的。总共扔了两次,都是“花”朝上,虽然几率是0.5×0.5=0.250转载 2020-10-10 16:37:43 · 2103 阅读 · 0 评论 -
最全的正则(python)基础知识
正则表达式简介起源于1951年数学家斯蒂芬·科尔·克莱尼发明的一种称之为“正则集合”的数学符号。定义即文本的高级匹配模式,提供搜索,替换等功能。其本质是由一系列字符和特殊符号构成的字串,这个字串即正则表达式。原理通过普通字符和有特定含义的字符,来组成字符串,用以描述一定的字符串规则,比如:重复,位置等,来表达某类特定的字符串,进而匹配。普通字符匹配规则:每个普通字符匹配其对应的字符e.g.In : re.findall('ab',"abcdefabcd")Out: ['ab原创 2020-10-10 16:36:28 · 1048 阅读 · 0 评论 -
AHP&AHM
AHP&AHM一、引言二、在准则 CCC 下元素的两两比较和排序2.1 重量模型 - 层次分析法2.2 球赛模型 - 属性层次模型2.3 注记三、判断矩阵和属性判断矩阵参考文献一、引言Saaty 在 1977 年提出了层次分析法 AHP,之后程乾生在 1997 年提出了属性层次模型 AHM,这两种方法都是为了解决无结构决策问题,运用 AHM 进行决策的步骤和 AHP 一样,大体可分为三步:建立递阶层次结构;构造判断矩阵并计算相对权;计算方案对系统目标的合成权,以进行决策。层次分析法和原创 2020-05-10 20:53:29 · 2849 阅读 · 0 评论