- 博客(21)
- 资源 (3)
- 收藏
- 关注
原创 Java分类统计次数,取max
/** 最近1个月使用频率最高银行 **/ public String BC0041004(List<BankTransInfo> sources, String batchNo) { List<BankTransInfo> computeList = BankCardAnalysisUtil.filterBankCardTransInfo(sources, batchNo,
2015-10-30 11:41:04
863
转载 基于FP-Tree的关联规则FP-Growth推荐算法基本思想
在挖掘关联规则的过程中,无可避免要处理海量的数据,也就是事务数据库如此之大,如果采用Apriori算法来挖掘,每次生成频繁k-项集的时候,可能都需要扫描事务数据库一遍,这是非常耗时的操作。那么,可以想尽办法来减少扫描事务数据库的次数,来改进挖掘频繁关联规则的效率。 FP-tree是频繁模式树,它是将整个事务数据库压缩到一棵频繁模式树上。而且,在构造整个事务数据库的的FP-tree的过程中,只需要扫描
2015-10-27 17:56:39
2896
原创 Java Map Key-Value
/** 充值电话的电话号码、次数、金额(txt) **/ public String AP0050011(List<TransInfoCsv> sources, String batchNo) { List<TransInfoCsv> computeList = AlipayAnalysisUtil.filterTransInfoCsv(sources, batchNo, n
2015-10-15 14:46:24
349
转载 随机森林代码
library(randomForest)totaldata<-read.table("/export/tangjie/leak_change.txt",header = FALSE,sep = '\t')names(totaldata)<-c('pin','p_book','n_book','m_book','office','music','luxury','fitness','adult_
2015-09-22 17:44:41
1149
转载 基础知识
反欺诈https://linkurio.us/category/tutorial/这个包含了6页,主要是讲解怎么利用关系图来找出异常点,后面的几页重点在讲解反欺诈问题。 http://www3.cs.stonybrook.edu/~leman/icdm12/这个slides包含了大部分跟关系图(graph)有关的技术,由这领域的权威整理。
2015-09-06 11:36:39
460
原创 基于RCurl包的爬虫技术
library(RCurl)library(XML)myHttpheader <- c( "User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) ", "Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
2015-04-30 18:40:43
1013
原创 第七次作业
统计软件第七次作业处理缺失值(knn和相关性)第一题利用变量间的相关性借补时,由于会发生最相关的变量对应位置处的观测值也恰好缺失的情形,所以请将这样的情形也考虑在内,即考虑用能借补的那些变量中相关性最大的那个即可。代码library(DMwR)data(algae)head(algae)algae1<-algae[manyNAs(algae,0),]algae2<-algae[-manyNA
2015-04-19 18:14:41
448
翻译 案例代码
文本词汇索引f函数以及对索引结果进行排序f1f<-function(x){ txt<-scan(x,'') txt1<-list() for(i in 1:length(txt)){word<-txt[i]txt1[[word]]<-c(txt1[[word]],i) } return(txt1)}f1<-function(x){ txt2<-names(x) n
2015-03-24 16:14:11
456
翻译 求两点间最短距离
求两点间最短距离f1<-function(x){ lx<-length(x) i<-x[lx] j<-which.min(x[(i+1):(lx-1)]) k<-i+j return(c(k,x[k]))}f2<-function(y){ n<-nrow(y) yy<-cbind(y,1:n) y1<-apply(yy[-n,],1,f1) i<-which.
2015-03-24 09:07:43
776
翻译 新文档
求两组数据同时上升和下降的比例 f<-function(x){ b=x[-1]-x[-length(x)] return(ifelse(b>0,1,-1))}f1<-function(x,y){ c=lapply(list(x,y),f) return(mean(c[[1]]==c[[2]]))}一个同等代码f2<-function(x,y) mean(sign(diff(
2015-03-22 17:20:53
299
转载 欢迎使用优快云-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2015-03-22 17:19:42
249
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人