NCDC的数据资源
网址 ftp://ftp.ncdc.noaa.gov/pub/data/noaa/
数据采集脚本
入门,稍微老一点 http://blog.youkuaiyun.com/hitwengqi/article/details/8008203
eclipse + hadoop插件 指导 http://www.cnblogs.com/shishanyuan/p/4178732.html 插件的构建方法下面有。
hadoop2.6.0 2.0.0以上暂时都是这个插件 https://github.com/winghc/hadoop2x-eclipse-plugin 下载源代码及构建方法都在这个网页中 NOTE:构建过程需要1个多小时(双核2.2,8G DDRIII内存),或许还更多。
如果出现错误An internal error occurred during: "Map/Reduce location status updater". java.lang.NullPointerException ,只要是NullPointerException都可以不管,没什么问题,新建hadoop工程执行是没有任何问题的。其他的需要针对性对待。