
hadoop
文章平均质量分 83
iteye_12877
这个作者很懒,什么都没留下…
展开
-
hive 操作专利数据笔记
create table cite(citing int,cited int)row format deliminted fields terminated by ','stored as textfile;load data inpath '/tmp/file1.txt' overwrite into table cite;select * from cite l...2013-12-06 19:18:35 · 150 阅读 · 0 评论 -
Hadoop 自定义数据类型实例
一、来自 hadoop in action 上的实例,我在这里做了一个总结。文件内容如下:17:16:20 http://blackproof.iteye.com/blog/180626317:16:21 http://blackproof.iteye.com/blog/180626417:16:56 http://blackproof.iteye.com/blog/1806265...2013-11-23 16:21:26 · 199 阅读 · 0 评论 -
Hadoop 统计不同引用次数的专利数目(三)
一、在(二)的基础之上做修改,代码如下: import java.io.IOException;import org.apache.hadoop.conf.Configured;import org.apache.hadoop.fs.Path;import org.apache.hadoop.io.IntWritable;import org.apache.hadoo...2013-11-23 16:14:36 · 274 阅读 · 0 评论 -
Hadoop 统计专利被引用次数(二)
一、在(一)中,我们计算出专利被那些专利所引用,在此基础上计算被引用的次数,不难实现。我们用两种方法来完成。代码(1)如下: import java.io.IOException;import org.apache.hadoop.conf.Configured;import org.apache.hadoop.fs.Path;import org.apache.hado...原创 2013-11-23 16:03:45 · 968 阅读 · 0 评论 -
Hadoop 统计专利被那些专利所引用(一)
一、以下是测试数据:"CITING","CITED"3858241,9562033858241,13242343858241,33984063858241,35573843858241,36348893858242,15157013858242,33192613858242,36687053858242,37070043858243,2949611...2013-11-23 13:01:27 · 585 阅读 · 0 评论