文字说明
Map端的输出结果首先会被与入到缓存中【比磁盘效率高】,
当缓存满时(80%写入后),就会启动流与掷作;
溢写操作会清空内容,把内容写入到磁盘空间。
每次溢写操作会写一个磁盘文件(key,value),
当Map程序运行完成后,会把这个Map程序产生的溢写文件归并成一个大的文件(key,value1,value2,…),
然后通知Reduce端来取数据
文字说明
Map端的输出结果首先会被与入到缓存中【比磁盘效率高】,
当缓存满时(80%写入后),就会启动流与掷作;
溢写操作会清空内容,把内容写入到磁盘空间。
每次溢写操作会写一个磁盘文件(key,value),
当Map程序运行完成后,会把这个Map程序产生的溢写文件归并成一个大的文件(key,value1,value2,…),
然后通知Reduce端来取数据