- 博客(10)
- 收藏
- 关注
原创 收藏的一些博文
SVD http://wenku.baidu.com/link?url=dqorn6e4Cm0GrOO9oKc0f8R9B-xDiWJyvDlRHAhLeDHhdO40AX03Y6lBA6WCCQCLoNzxjvhMlfcE0D3bCDf42bmWNCQvB5qk4E0Lcuin5zS正则表达式 http://www.cnblogs.com/huxi/archive/2010/0
2015-07-28 17:06:28
472
转载 后剪枝之悲观剪枝法
转自http://blog.youkuaiyun.com/woshizhouxiang/article/details/17679015把一颗子树(具有多个叶子节点)的分类用一个叶子节点来替代的话,在训练集上的误判率肯定是上升的,但是在新数据上不一定。于是我们需要把子树的误判计算加上一个经验性的惩罚因子。对于一颗叶子节点,它覆盖了N个样本,其中有E个错误,那么该叶子节点的错误率为(E+0.5)/N
2015-07-23 16:57:01
8880
3
转载 后剪枝技术之代价复杂性剪枝
参考博文http://blog.youkuaiyun.com/tianguokaka/article/details/9018933在分类回归树中可以使用的后剪枝方法有多种,比如:代价复杂性剪枝、最小误差剪枝、悲观误差剪枝等等。这里我们只介绍代价复杂性剪枝法。对于分类回归树中的每一个非叶子节点计算它的表面误差率增益值α。是子树中包含的叶子节点个数;是节点t的
2015-07-23 15:31:30
7075
1
原创 Apriori算法的python实现
def loadDataSet(): return [[1,3,4],[2,3,5],[1,2,3,5],[2,5]]def creatC1(dataSet): C1=[] C=[] for transaction in dataSet: C=C+transaction C=list(set(C)) for i in C:
2015-07-20 10:53:46
659
原创 层次聚类算法的python实现
文章给出层次聚类算法的python实现方法,并用《数据挖掘导论》里面的具体数据进行运行,代码如下:from numpy import *from math import *from operator import *def dist(a,b):#a,b is mat c=(a-b)*(a-b).T return sqrt(sum(c)) def centroid
2015-07-10 10:35:26
2852
转载 python正则表达式
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例。本文的内容不包括如何编写高效的正则表达式、如何优化正则表达式,这些主题请查看其他教程。注意:本文基于Python2.4完成;如果看到不明白
2015-07-06 16:30:42
259
转载 windows上安装numpy和scipy
windows上安装numpy和scipy:http://sourceforge.net/projects/numpy/files/NumPyhttp://sourceforge.net/projects/scipy/files/Scipy下载和你Python版本相应对的exe文件安装即可。感觉这个最简单无脑了
2015-07-06 14:31:44
267
原创 怎样在CentOS下安装Python的numpy包和scipy包
yum直接安装sudo yum -y install gcc gcc-c++ numpy python-devel scipy千万记得centOS要连接网络。。。之前一直没联网,怎么都不行。。
2015-07-02 13:19:01
722
转载 Spark的transformations和actions操作解释
分布式数据集操作分布式数据集支持两种操作:转换(transformation):根据现有的数据集创建一个新的数据集动作(actions):在数据集上运行计算后,返回一个值给驱动程序例如,Map是一个转换,将数据集的每一个元素,都经过一个函数进行计算后,返回一个新的分布式数据集作为结果。而另一方面,Reduce是一个动作,将数据集的所有元素,用某个函数进行聚合,然
2015-07-01 16:10:16
1543
原创 初学Spark——关于安装Spark
折腾了两天多,终于把Spark安装成功。由于之前并非计算机专业,所以各个地方全是慢慢摸索。下面总结如下:1、windows环境下的Spark不会安装,转安装到linux系统下。2、安装VNWare,之后再安装centOs7.03、安装流程主要参考zhangyuming010的博文,以后也打算长期研究他的博文。http://blog.youkuaiyun.com/zhangyuming010/art
2015-07-01 14:08:22
334
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人