
Apache Spark
文章平均质量分 62
丑大狗
不想成为
数据科学家
的DBA
不是好开发
展开
-
cloudera hadoop 配置文件位置
cloudera hadoop 配置 文件 位置原创 2016-08-18 21:34:14 · 3946 阅读 · 0 评论 -
jps 报process information unavailable解决办法
jps时出现如下信息:4791 -- process information unavailable解决办法:进入tmp目录,cd /tmp删除该目录下名称为hsperfdata_{username}的文件夹然后jps,清净了。转载 2016-08-19 21:49:08 · 891 阅读 · 0 评论 -
Spark 从入门到放弃 之 quick start
使用spark shell进行交互式分析上传一个文件到hdfs上的如下目录/user/hdfs/-bash-4.1$ hadoop fs -put README.md /user/hdfs/-bash-4.1$ hadoop fs -ls /user/hdfsFound 3 itemsdrwxr-xr-x - hdfs supergroup 0 2016-原创 2016-08-21 16:10:32 · 1487 阅读 · 0 评论 -
spark从入门到放弃 之 分布式运行jar包
scala代码如下:import org.apache.spark.SparkConfimport org.apache.spark.SparkContextimport org.apache.spark.SparkContext._/** * 统计字符出现次数 */object WordCount { def main(args: Array[String]) {原创 2016-08-22 16:04:26 · 8405 阅读 · 2 评论 -
给想测试spark memory_and_disk 存储级别的人的一个忠告
生成的测试文件一定要有换行符啊,如果只有一整行就要呵呵了。因为源码里是readline()原创 2016-08-23 14:31:21 · 3452 阅读 · 2 评论 -
Spark1.5的一个bug
>>> 16/10/15 20:07:35 INFO YarnClientSchedulerBackend: Requesting to kill executor(s) 116/10/15 20:07:35 INFO ExecutorAllocationManager: Removing executor 1 because it has been idle for 60 seconds (n原创 2016-10-27 16:34:25 · 1615 阅读 · 0 评论