
大数据
爱吃面包的欣儿欣儿
不期待突如其来的好运,只希望所有的努力终有回报。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
python连接hive
安装需要的模块(有的可以忽略) # pip install sasl(wheel:https://www.lfd.uci.edu/~gohlke/pythonlibs) # pip install thrift # pip install thrift-sasl # pip install PyHive 执行代码 from pyhive import hive conn = hive....原创 2020-03-21 23:51:07 · 212 阅读 · 0 评论 -
大数据
一,大数据简单介绍 大数据的4大特性: 数据量巨大:G<T<PB<EB<ZB 数据类型多样 价值密度低,商业价值高 速度要求快,输入输出,计算速度要求快 常见的分布式文件存储系统 GFS(Google File System):擅长处理单个大文件 HDFS(Hadoop Distributed Filesystem):擅长处理单个大文件 ClusterFS:集...原创 2020-03-17 00:21:48 · 167 阅读 · 0 评论