- 博客(5)
- 收藏
- 关注
原创 python 编码问题技巧
如果遇到不知道什么编码的文件,检测该文件是什么编码.最好不要检测整个文档的编码,而是要检测文档中出现乱码的那部分内容的编码,以提高准确性.import chardetf=open(''a')chardet.detect(f.read())假设返回结果为GBK则for each in f: print each.decode('GBK').encode('UTF-
2015-07-09 15:08:22
386
原创 R语言遇到bug的处理方法
R有时会出现无法解释的错误,看了一次老外的帖子,才晓得是R包版本的问题,因为在开发包的时候,有的包是依赖其他包开发的,当其他包的版本改变时,兼容性就是问题啦。看了这个立马明白,两个星期中文分词问题解决啦。开源软件这点确实不好,如果是SAS,应该不会有这样的问题~~
2014-11-01 20:49:19
950
转载 win764位rjava配置
1,首先需要安装64位jdk,这个是必须的,2,在64位R中安装rJava,这时候运行 library(rJava)会报计算机缺少jvm.dll,需要把E:\jdk1.6\jre\bin\server下面的jvm.dll拷贝到E:\jdk1.6\bin下,然后 library(rJava)可以正常运行但是我们运行.jinit()就会一直假死,这是因我们随意移动jvm.dll,然后会根据这个
2014-10-30 15:08:08
612
原创 梯度下降算法-R语言
#读取自变量、因变量数据x<-read.table("ex2x.txt")y<-read.table("ex2y.txt")Y=y[[1]]m<-length(y[[1]])#自变量增加一列构造矩阵x1<-rep(1,m)x2<-x[[1]]X<-data.frame(x1,x2)X<-as.matrix(X)#初始化参数theta<-matrix(c(0,0),ncol=1
2014-10-30 08:38:07
11499
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人