Pig是什么
Hadoop上的
数据流执行引擎(由Yahoo!开源)
利用HDFS存储数据
利用MapReduce处理数据
使用Pig Latin语言表达数据流
Pig Latin是一种新的数据流语言
Pig将Pig Latin语句转化为MapReduce作业
Pig Latin比MapReduce程序更易编写
直接产生动机:让MapReduce用起来更简单
&n

Pig是Hadoop生态系统中的一种数据流执行引擎,由Yahoo!开源。它提供Pig Latin语言,使数据处理比直接编写MapReduce作业更简单。Pig Latin将语句转化为MapReduce任务,支持在HDFS上存储和处理数据。虽然Pig与Hive在目的和运行环境上相似,但Pig不需要预定义Schema,并且使用非SQL的数据流语言Pig Latin,强调如何处理数据而非直接定义结果。
最低0.47元/天 解锁文章
1174

被折叠的 条评论
为什么被折叠?



