
【18】大数据
LGX_TvT
小步快跑
展开
-
Lucene全文检索
参考资料: https://www.yiibai.com/lucene/ 黑马培训教程Lucene全文检索Lucene是简单而功能强大的基于Java的搜索库。它可以用于任何应用程序来搜索功能。 Lucene是开源项目。它是可扩展的,高性能的库用于索引和搜索几乎任何类型的文本。 Lucene库提供了所需的任何搜索应用程序的核心业务。索引和搜索。常见数据结构化数据指具有固定格式...原创 2018-06-18 12:59:20 · 1059 阅读 · 0 评论 -
Hadoop 分布式文件系统 HDFS
Hadoop 分布式文件系统 HDFS文章目录Hadoop 分布式文件系统 HDFS1. 概述2. HDFS概念2.0 HDFS 架构图2.1 数据块(block)2.2 namenode 与 datanode2.2.1 NameNode2.2.2 DataNode2.2.3 HDFS Client2.2.4 HDFS故障处理2.2.5 HDFS 安全模式什么是元数据?2.3 联邦HDFS(HD...原创 2019-03-07 11:55:33 · 894 阅读 · 0 评论 -
尚学堂大数据学习笔记(六)Hive安装配置
文章目录1. MySQL安装与配置1.1 安装MySQL1.2 配置MySQL2. Hive安装与配置2.1 上传安装文件2.2 解压文件2.3 拷贝mysql驱动包到Hive的lib文件夹下(node2)2.4 配置环境变量(node2,node3)2.5 修改服务端配置文件(node2)2.6 修改客户端配置文件(node3)2.7 启动Hive2.7.1 启动服务端(node2)2.7.2 ...原创 2019-02-13 01:03:18 · 895 阅读 · 0 评论 -
尚学堂大数据学习笔记(五)MapReduce简单案例2:好友推荐 FOF
1. 需求推荐可能认识的好友初始数据集tom hello hadoop catworld hadoop hello hivecat tom hivemr hive hellohive cat hadoop world hello mrhadoop tom hive worldhello tom world hive mr分为直接关系(0)与间接关系(1)计算2. 具体...原创 2019-02-10 21:14:31 · 1249 阅读 · 1 评论 -
尚学堂大数据学习笔记(五)MapReduce简单案例1:找出每个月气温最高的2天
1. 数据集具体格式如下:1951-07-03 12:21:03 47c1949-10-01 14:21:02 34c1949-10-01 19:21:02 38c1949-10-02 14:01:02 36c1950-01-01 11:21:02 32c1950-10-01 12:21:02 37c1951-12-01 12:21:02 23c1950-10-02 12:21:0...原创 2019-02-09 21:50:10 · 1859 阅读 · 1 评论 -
Solr 7.3 (一)
Solr原创 2018-06-18 16:41:08 · 2395 阅读 · 4 评论 -
尚学堂大数据学习笔记(二) CentOS6.5 + JDK8 + hadoop2.6.5 搭建Hadoop集群
文章目录尚学堂大数据学习笔记(二) CentOS6.5 + JDK8 + hadoop2.6.5 安装配置HDFS1. 安装CentOS6.5系统1.1创建CentOS6.5系统虚拟机1.1虚拟机创建1.2 开启ssh服务1.3 更改hostname2 配置Host3. 安装配置JDK83.1 上传jdk3.2 解压3.3 将解压后的jdk包拷贝到`/usr/java`目录3.4 在所有节点上配置...原创 2019-09-18 10:29:33 · 796 阅读 · 0 评论