1、machine learning:人工智能的核心,重点是归纳、综合而不是演绎
2、crowdsourcing:众包,区别于外包,外包高度专业化,众包跨专业多领域eg:宝洁、eBay、亚马逊、宝马等
3、HDFS是Google GFS 的开源版本,一个高度容错的分布式文件系统,它能够提供高吞吐量的数据访问,适合存储海量(PB 级)的大文件(通常超过64M)
4、Hadoop是Apache 下的一个项目,由HDFS、MapReduce、HBase、Hive 和ZooKeeper等成员组成。其中,HDFS 和MapReduce 是两个最基础最重要的成员。
5、关于Hadoop的mapreduce的原理学习的一个网址http://blog.youkuaiyun.com/thomas0yang/article/details/8562910,还未看完,看着不错,有时间继续钻研!
6、函数式编程又叫泛函编程:重点是λ演算(lambda calculus,如ML(强静态类型)