
hadoop
Charmian Chen
求其上者得其中,求其中者得其下。
展开
-
ES简单实用DSL查询
ES简单实用DSL查询https://www.jianshu.com/p/3cb205b5354ahttps://www.cnblogs.com/kongzhagen/p/7899346.html原创 2020-02-24 15:06:51 · 341 阅读 · 0 评论 -
Elasticsearch基本知识和操作
慕课网教程:https://www.imooc.com/learn/8891.1Lucene倒排索引:搜索引擎的关键就是建立倒排索引结构。假设有两篇文章1和文章2文章1内容:Tom lives in Guangzhou, I live in Guangzhou,too文章2内容:He once live in Shanghai1.对内容进行处理,取得关键词文章1所有关键词:...转载 2020-02-24 14:53:27 · 154 阅读 · 0 评论 -
流式数据、批式数据、实时数据、历史数据的区别
1.流式数据、批式数据、实时数据、历史数据的区别:根据数据处理的时效性,大数据处理系统可分为批式(batch)大数据和流式(streaming)大数据两类。其中,批式大数据又被称为历史大数据,流式大数据又被称为实时大数据。举个例子来说:我们把数据当成水库的话,水库里面存在的水就是批式大数据,进来的水是流式大数据。复杂的批量数据处理(batch data processing...转载 2020-02-24 12:04:06 · 3702 阅读 · 0 评论 -
HIVE的常用操作-建库和表-插入数据
使用hive-----------------------启动hadoop启动hive创建数据库:create database myhive;查看数据库:hive (default)> show databases;OKdatabase_namedefaultmyhive数据准备:employees.txt1201 Gopal 45000 ...转载 2020-02-20 13:38:52 · 728 阅读 · 0 评论 -
hadoop HDFS常用文件操作命令
hadoop HDFS常用文件操作命令命令基本格式: 1 hadoop fs-cmd < args > 1. ls 列出hdfs文件系统根目录下的目录和文件 1 hadoop fs-ls/dir 1 hadoop fs-ls-R/dir...转载 2020-02-20 12:14:15 · 312 阅读 · 0 评论