自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Jack‘s bolg

时人不识凌云木，直待凌云始道高

博客等级

码龄16年

67
原创

7
点赞

22
收藏

90
粉丝

关注

私信

热门文章

分类专栏

Machine Learning 6篇
Data Mining 2篇
RecSys
Java 11篇
Python 5篇
Hadoop 26篇
MySQL
Math 1篇
BigData 13篇
Design pattern 35篇
Linux 13篇
Information Retrieval 1篇
Others 3篇
NoSQL
Shell 1篇
Algorithm 1篇
Tools 5篇
Scala 12篇
Spark 6篇

最新评论

Hadoop 二次排序 Secondary Sort
mulangren1988: setSortComparatorClass 在二次排序中是必须的吗？ GroupingComparator 和 KeyComparator 两个的实现不是一样的吗？
GraphX中Pregel单源点最短路径
sinat_35206416: 你好，这是求单源最短路径，怎么才能并行求多源路径。我尝试把他写成方法调用，然后把需要求得点对生产rdd,再map调用单源方法，但rdd不能嵌套rdd。另一方面，我感觉他肯定是可以并行的，因为求每一个结点单源路径和其他结点不相关，只是不知道怎么并行。急求！！！
疯狂Java讲义笔记
qq_34038017: 书上说null甚至不和null相等，obj即使是null也不相等，那用obj！=null判断是否为空还有用吗？
MapReduce Design Patterns-chapter 2
cxvc: 请问数据在哪可以找到啊
Spark with Hadoop InputFormat
yadanfu: public <K,V,F extends org.apache.hadoop.mapreduce.InputFormat<K,V>> JavaPairRDD<K,V> newAPIHadoopFile(String path, Class<F> fClass, Class<K> kClass, Class<V> vClass, org.apache.hadoop.conf.Configuration conf) Get an RDD for a given Hadoop file with an arbitrary new API InputFormat and extra configuration options to pass to the input format. '''Note:''' Because Hadoop's RecordReader class re-uses the same Writable object for each record, directly caching the returned RDD will create many references to the same object. If you plan to directly cache Hadoop writable objects, you should first copy them using a map function.

Spark

关注

文章平均质量分 76

关注数：文章数：6 文章阅读量：35720 文章收藏量：1

作者: Jack_F

唉生活唉社交

展开

专栏收录文章