
大数据处理
文章平均质量分 78
_依然_
这个作者很懒,什么都没留下…
展开
-
论文学习笔记:MapReduce
前言:Google大数据处理的3篇核心论文《The Google File System》:http://research.google.com/archive/gfs.html《MapReduce: Simplified Data Processing on Large Clusters 》:http://research.google.com/archive/mapreduce原创 2013-10-27 14:59:58 · 3416 阅读 · 0 评论 -
论文学习笔记:BigTable
前言:Google大数据处理的3篇核心论文《The Google File System》:http://research.google.com/archive/gfs.html《MapReduce: Simplified Data Processing on Large Clusters 》:http://research.google.com/archive/mapreduce原创 2013-11-03 11:07:12 · 3024 阅读 · 0 评论 -
论文学习笔记:GFS
前言:Google大数据处理的3篇核心论文《The Google File System》:http://research.google.com/archive/gfs.html《MapReduce: Simplified Data Processing on Large Clusters 》:http://research.google.com/archive/mapreduce.htm原创 2013-10-22 00:08:24 · 7851 阅读 · 1 评论 -
中文分词实践(基于R语言)
背景:分析用户在世界杯期间讨论最多的话题。思路:把用户关于世界杯的帖子拉下来,然后做中文分词+词频统计,最后将统计结果简单做个标签云,效果如下后续:中文分词是中文信息处理的基础,分词之后,其实还有特别多有趣的文本挖掘工作可以做,也是个知识发现的过程,以后有机会再学习下。原创 2014-07-13 13:30:43 · 13505 阅读 · 6 评论