
大数据
kong_ch
这个作者很懒,什么都没留下…
展开
-
Windows搭建redash环境(最新测试,网上别的教程错误很多)
一 简介 如果说Superset是构建一个BI平台,那Redash目标就是更纯粹地做好数据查询结果的可视化。Redash支持很多种数据源,除了最常用的SQL数据库,也支持MongoDB, Elasticsearch, Google Spreadsheet甚至是一个JSON文件。Redash的官方文档里列出了它所支持的所有数据源。 它不需要像Superset那样在创建图表前先定义表和指标,而是可...原创 2019-11-05 10:24:04 · 2998 阅读 · 11 评论 -
大数据入门之大数据简介及Hadoop环境的搭建(一)
一,大数据的概念 从字面上可以理解,大数据就是数据量比较大,用传统的工具处理不了。 大数据的数据量复杂,多样性。例如 数据包括 图片,视频,文字等。 速度快。通过分布式存储,分布式计算,云计算等工具进行快速的处理。 具有高度分析的新价值。通过海量的数据,进行分析判断,为个人或者企业的行动作出决策。 二,大数据带来的技术变革 存储:文件存储==》分布式存储 计算:单机==》分布式计算 网络:万...原创 2019-08-16 17:32:29 · 342 阅读 · 0 评论 -
mapreduce上传到YARN上,map运行,没有reduce的原因?
异常:Error: org.apache.hadoop.mapreduce.task.reduce.Shuffle$ShuffleError: error in shuffle in fetcher#5 Caused by: java.io.IOException: Exceeded MAX_FAILED_UNIQUE_FETCHES; bailing-out。 对于这个异常在网上查了很多办法...原创 2019-08-29 15:34:27 · 471 阅读 · 0 评论