软件工程培训第六天(spark的简单使用和hive的用法)

一、学习过程

 今天讲了spark的安装和spark的运行机制,然后老师重点将了下spark中的RDD然后就是我们自己联系word上的实例和例子的时间了

二、总结

  Spark我感觉用一天时远远不够的,老师文档就给我们发了七八个,这一下午也就看完了一个,今天我把RDD的20多个基本的函数看了一遍,然后按照word上的例子进行了总结,感觉RDD就是在用一些别人写好的mapreduce函数,他的代码量要比直接写mapreduce少的多,也正因为这个,对于RDD的一些函数的参数理解起来有一点点困难,不过一下午也不是白过的,对于那二十多个常用函数我已经基本上了解,这也是今天最主要的收获。

三、问题汇总

   Spark的内容很多,感觉今天学到的东西离可以实际的去写一个简单的实际需求还差的很远,spark中的RDD与其他大数据模块的数据传递连接,以及他们之间的区别还没有弄清楚

三、思维导图

 

转载于:https://www.cnblogs.com/837634902why/p/11478171.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值