Apache Mahout Cookbook 书中 Chapter 2. Using Sequence Files – When and Why? 对于序列化过程介绍的比较清楚
转换工具类:
mahout seqdirectory:将文本文件转成SequenceFile文件,SequenceFile文件是一种二制制存储的key-value键值对,对应的源文件是org.apache.mahout.text.SequenceFilesFromDirectory.java
源码分析:http://blog.youkuaiyun.com/zmc_happy_blog/article/details/25630311
查看转化结果:
mahout seqdumper:将SequenceFile文件转成文本形式,对应的源文件是org.apache.mahout.utils.SequenceFileDumper.java
本文详细解析了Apache Mahout Cookbook中关于序列化过程的使用、何时使用及为何选择序列化的原因。介绍了两个关键工具类:mahoutseqdirectory用于将文本文件转换为SequenceFile格式,mahoutseqdumper则用于将SequenceFile文件还原为文本形式。
1166

被折叠的 条评论
为什么被折叠?



