
hadoop
bo_hai
这个作者很懒,什么都没留下…
展开
-
Hadoop 统计专利被那些专利所引用(一)
04 3858243,2949611 3858243,3146465 3858243,3156927 3858243,3221341 3858243,3574238 3858243,3681785 3858243,3684611 3858244,14040 3858244,17445 3858245,17445 注:第一列是专利号,第二列是引用的专利号。 二、Hadoop 代码如下: import java.io.IOException; import org.apa2013-11-23 13:01:27 · 218 阅读 · 0 评论 -
Hadoop 统计专利被引用次数(二)
ava.io.IOException; import org.apache.hadoop.conf.Configured; import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Ma原创 2013-11-23 16:03:45 · 405 阅读 · 0 评论 -
Hadoop 统计不同引用次数的专利数目(三)
.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Job; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.mapreduce.Reducer; import org.apache.hadoop.mapre2013-11-23 16:14:36 · 105 阅读 · 0 评论 -
Hadoop 自定义数据类型实例
64 17:16:56 http://blackproof.iteye.com/blog/1806265 17:16:30 http://blackproof.iteye.com/blog/1806266 17:16:45 http://blackproof.iteye.com/blog/1806267 17:16:23 http://blackproof.iteye.com/blog/1806268 需求是:把后面的URLString 封装成 URL类型。代码如下: import ja2013-11-23 16:21:26 · 84 阅读 · 0 评论 -
hive 操作专利数据笔记
imit 10; create table cite_count(cited int ,count int); insert overwrite table cite_count select cited,count(citing) from cite group by cited; select * from cite_count limit 10; alter table cited_count rename to cite_count; create table cit2013-12-06 19:18:35 · 188 阅读 · 0 评论