- 博客(82)
- 收藏
- 关注
原创 Fedora17安装 rhabse时Thrift安装错误解决方法
thrift安装后就可以安装thbase,在R中,执行R CMD INSTALL rhbase_1.1.1.tar.gz会出现如下的错误:找不到TProcess.h执行pkg-config –cflags thrift如果没有任何输出,则需要执行export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig/这样再安装rhbase时可能还是会出现
2014-03-20 10:19:23
1168
原创 logistic regression与R
logistic regression可以用在CTR(Click Through Rate)预估上,即通常所说的点击率预估。点击率预估的意义在于,在电子商务中,可以通过把点击率高的商品放在首页或者重点推荐给用户,这样用户可以有更大的机会看见这些易受欢迎的商品,这样就可以促进销量,提高商家的利润。logistic函数也成sigmoid函数是在logistic回归中使用的函数,其形式为$35*d_
2014-03-17 21:25:04
2033
原创 Fedora17下MPI的安装及配置
linux下MPI的版本为openmpi,在fedora下安装很容易,执行:yum install openmpi openmpi-devel一句命令就安装完毕,但是安装完之后输入mpi+Tab会发现命令没有自动不全,说明openmpi没有被安装到系统默认的搜索路径中,需要配置一下,执行:whereis openmpi输出为openmpi: /lib/openmpi /usr/
2014-03-17 20:37:46
2296
原创 fedora17中hadoop2.2.0在eclipse下运行wordcount
hadoop2.2.0的eclipse插件在http://download.youkuaiyun.com/detail/acm_er6/6964345
2014-03-17 15:30:34
1379
转载 R语言的数据转换: split – apply – combine 模式
在数据分析中,有许多问题可以由类似的类型和方法步骤解决,可称之为模式,设计模式或者分析模式。下面要讨论的是数据转换的一个常用模式:split – apply – combine。其解决之道,在R语言中,有3种方式:(1) for 显式循环,但是这种方式的缺点也很明显,代码长,易出错,也难以并行化;(2) 拜R语言的向量计算特点所赐,在R当中,大多数问题不需要用显示循环方式,而代之以base
2014-03-16 12:00:15
1790
原创 R中安装rgl时“configure: error: missing required library GL”错误的解决方法
今天使用R时需要画一张3D图,于是在R中安装rgl包,由于依赖关系,安装过程中会提示如下的错误,根据提示可以看到是因为没有GL库,所以就需要安装gl的包,在Fedora17中开源的gl包为mesa,所以在root下需要执行yum install mesa*就可以把相关的包以及开发包下载并安装。安装好之后在R下继续执行install.pakages("rgl"),系统还是会报一样的错误,这时
2014-03-15 23:50:22
4335
1
原创 R软件读取中文编码的数据错误解决方法
今天下载了一个csv文件,用vim打开后发现乱码,编码出现了问题,vim中文编码是UTF-8,我觉得这个文件可能是GBK,所以出现了问题,所以需要设置vim,打开家目录下的.vimrc文件,如果没有就新建一个,在里面添加set encoding=utf-8set fileencodings=ucs-bom,utf-8,cp936set fileencoding=gb2312set terme
2014-03-12 11:53:15
4110
原创 大数据之起步搭开发环境
上个星期电脑被我搞坏了之后很多软件就没再安装了,昨天看到阿里宣传的大数据比赛,于是连夜开始重新安装数据挖掘的各种软件,下面就记录一下,也算是记下我比赛的进程吧:系统:3.9.10-100.fc17.i686.PAE包管理软件为Yum,有了Yum,再也不担心软件安装的依赖性问题,首先安装Java,由于之前安装Textlive中依赖Java,所以这里就没必要再安装了,有了Java后就安装Mah
2014-03-11 08:41:29
1230
原创 binary-search之Scheme实现
这里有具体的讨论,并配有C的代码,https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/25.0.md
2014-03-09 00:48:38
1001
原创 亲和数问题--求解500万以内的亲和数之—Scheme语言实现
https://github.com/julycoding/The-Art-Of-Programming-By-July/blob/master/ebook/zh/06.0.md
2014-03-06 19:46:45
1368
原创 Scheme进阶学习
复杂的操作当然就涉及到如何操作过程了,过程与数据的地位是一样的,所以过程的使用就变化多端,学会各种操作过程的方法也就掌握了Scheme的精华。
2014-03-06 09:48:29
1436
1
原创 寻找最小的K个数
今天看到一篇文章,http://blog.youkuaiyun.com/v_JULY_v/article/details/6370650
2014-03-05 18:33:29
983
原创 使用autoconf和automake创建小项目
用了两天将之前的Snake游戏重新组织了一下,使用autoconf和automake按照GNU的安装软件组织布局重新编译并测试安装通过,第一次做这样的事情,很多知识查了很多资料才弄明白,最后克服了困难,可以把snakes安装到电脑上了。下面就描述一下,希望能帮到其他新手。
2014-03-04 08:35:36
1225
翻译 洗牌算法-神级算法来源
##### 2.3.5、How comes the Magic Conclusion?Our problem has been resolved, but this chapter has not been completed,how comes the Magic Conclusion that determines the perfect shuffle algorithm: if
2014-03-01 20:45:25
1119
翻译 洗牌算法3-完美洗牌算法
#### 2.3、Perfect shuffle algorithm perfect_shuffle3##### 2.3.1、cycle_leader algorithmEither perfect_shuffle1, or perfect_shuffle2, these two algorithms do not reach the time complexity of O (N) an
2014-03-01 14:23:42
1001
翻译 洗牌算法2-分治
###Solution 2 、Perfect shuffle algorithmWho has played poker knows,an in-shuffle of a deck of cards is done by cutting the deck into two equal halves and interleaving them perfectly, with the first
2014-03-01 10:54:48
1079
翻译 洗牌算法1-蛮力搜索
中文版本见https://github.com/lmdyyh/The-Art-Of-Programming-By-July/tree/master/ebook/zhTopic Details:There is an array of length 2n {a1, a2, a3, ..., an, b1, b2, b3, ..., bn}, hope to be {a1, b1, a2, b
2014-03-01 10:49:29
968
原创 /usr/bin/ld: cannot find -lX11解决方法
编译代码的时候链接阶段出现了问题,/usr/bin/ld: cannot find -lX11,看到这个信息时心里很是纳闷,在/usr/lib/路径下明明有libX11.so.6,为什么没有链接到呢,再三思索,最后想起-lX11其实代表的是全名是libX11.so,而/usr/lib/下确实没有这个文件,如果你不写-lX11,而是写/usr/lib/libX11.so.6,那么链接的时候链接器会准
2014-02-28 11:12:50
6931
原创 系统重装后如何重新pull自己GitHub上的仓储
由于系统重起了,当然本地的仓储和SSH生成的密钥就都没有了,这时如何在本地pull自己在GitHub上的仓储呢?
2014-02-28 00:43:38
1540
原创 Fedora17硬盘安装
人就是折腾,上午研究动态库时,执行了一个命令,mv /lib/libc-12.5.so . ,这个命令会让我记很长时间了,执行过之后发现我再执行任何命令都不行,而且用鼠标把这个动态库拷贝回原目录也不行,同学催着吃饭
2014-02-27 22:28:29
979
原创 /lib/libncurses.so: undefined reference to `__fdelt_chk@GLIBC_2.15' collect2: ld
类似次问题是当前运行系统Glibc版本低于编译环境Glibc版本造成Glibc版本兼容性造成的.
2014-02-27 09:07:22
8237
原创 Linux下用Libxml2读写XML文档
大型的数据可以存储到数据库中,某些数据量很小或者配置文件可以存储到XML这种半结构化的文档中,XML将数据组织成为一棵树,DOM通过解析XML文档,为XML文档在逻辑上建立一个树模型,树的节点是一个个的对象。这样通过操作这棵树和这些对象就可以完成对XML文档的操作,为处理文档的所有方面提供了一个完美的概念性框架。libxml 是针对 C 语言的一套 操作XML文档的API 接口。
2014-02-26 14:42:51
1681
原创 线程同步之mutex和条件变量
并发编程有两种基本模型,一种是消息传递,另一种是共享内存。在分布式系统中,运行在多台机器上的多个进程的并行编程只有消息传递。在多线程编程中,消息传递更容易保证程序的正确性。在用C/C++编写多线程程序时,我们需要了解共享内存模型下的同步原语。
2014-02-26 09:02:44
1443
原创 ncurses中经常使用的API
用ncurses开发了一个基于shell的贪吃蛇,在这里列出用的API即后续改进可能需要的函数:对于addch()和addstr(),我们经常会要求输出的字符带有某些特性,比如说颜色或者加粗,这时我们就需要给函数传递参数。比如:addch(ch | A_BOLD | A_UNDERLINE);输出加粗并且有下划线的ch。基本属性包含在ncurses.h头文件中,有:
2014-02-25 10:08:07
2465
原创 Makefile编写基本规则
经常使用linux的人一定会接触到Makefile,编译程序的时候使用make & make install编译安装源代码。Makefile编译源代码有一下的规则:1)如果这个工程没有编译过,那么我们的所有C文件都要编译并被链接。2)如果这个工程的某几个C文件被修改,那么我们只编译被修改的C文件,并链接目标程序。3)如果这个工程的头文件被改变了,那么我们需要编译引用了这几个头文件的
2014-02-24 00:02:36
1303
原创 C++中类成员函数作为回调函数的几种方法
写了一个C++小游戏,想法是间接别人的C语言,但是真正自己操作起来,还是会遇到各种问题,同时也让自己更真切的学到了一些过眼即忘,只有亲自动手才能学到的知识。
2014-02-23 22:11:08
6527
原创 C++编写的linux shell上可运行的贪吃蛇游戏
无意中看到了blog.youkuaiyun.com/jjzhoujun2010/article/details/6709827
2014-02-23 20:59:09
2333
1
原创 用GDB调试程序
辛苦了两天参考别人的C代码编了个C++小程序,程序编译是通过了,运行的时候出现段错误提示,没有办法只好调试程序,于是GDB走起。
2014-02-23 12:35:28
871
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人