- 博客(233)
- 资源 (2)
- 收藏
- 关注

原创 CDH5安装Kerberos认证
BUGBUG写在前面:Kerberos 1.15.1-18.el7.x86_64 版本有BUG,不要安装这个版本!!!!如果已安装上面描述版本不要怕,这里有一篇解决方案升级kerberos1.系统环境1.操作系统:CentOS Linux release 7.5.1804 (Core)2. CDH: 5.16.2-1.cdh5.16.2.p0.83. Kerberos:1.15.1-50.el7x864.采用root用户进行操作2.KDC服务安装及配置2.1.安装KDC服务在Cloude
2021-12-30 11:06:56
1800

原创 Oracle中Drop Table之后想恢复?来看这里[只要二步]
作用范围:下面方法仅仅适用于drop table,如果是delete 表中某些数据之后想要恢复请看这里,只需要三步。准备.查看数据库中,回收站里面存放的表名,以及drop table时的表名select object_name,original_name,type,droptime from user_recyclebin;方法一.根据drop table时删除的表名恢复表以及恢复......
2019-11-22 10:07:12
4483
1

原创 Oracle中Delete数据之后想恢复?来看这里[只要三步]
1.查询数据库当前时间(目的是为了检查数据库时间是否与你电脑时间相近,避免时间不同而将数据恢复到错误时间点)select to_char(sysdate,'yyyy-mm-dd hh24:mi:ss') from dual;2、查询删除数据时间点之前的数据select * from 表名 as of timestamp to_timestamp('2019-11-10 11:00:00',......
2019-11-20 11:37:03
1792

原创 DataX环境部署以及测试案例
DATAX简介DataXDataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。FeaturesDataX本身作为数据同步框架,将不同数据源的同步抽象为从源头数据源读取数据的Reader插件,以及向目标端写入数据......
2019-03-11 17:24:55
5067
2

原创 安装CentOS6.8并配置网络图文解说亲测全过程
安装环境:本文是在win10系统安装上VMWare并配置Centos6.8虚拟机。准备工作1.安装VMWare虚拟机1.1下载VMWare12资源链接:https://pan.baidu.com/s/1AhfMSDXLO-aA0eMqnuMWHg 提取码:iftd1.2安装VMWare,在安装过程中需要输入密钥,填写下面密钥即可,傻瓜式安装。5A02H-AU243-TZJ49-GTC7...
2019-01-16 19:27:08
1450

原创 5台机器搭建HA步骤与注意事项
HA是High Available缩写,是双机集群系统简称,指高可用性集群,是保证业务连续性的有效解决方案,一般有两个或两个以上的节点,且分为活动节点及备用节点。
2019-01-15 19:18:40
2610
4

原创 kettle入门之文本文件导入数据库
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。...
2019-01-01 13:40:58
4400
1

原创 使用Java实现发送email邮件
一、maven依赖 <dependency> <groupId>javax.mail</groupId> <artifactId>mail</artifactId> <version>1.4.7</version> </dependency&am...
2018-12-01 17:16:46
1676

原创 kafka使用说明书
首先要打开zookeeper,其次打开kafka,关闭时要先关闭kafka再关闭zookeeper启动zookeeperzookeeper-server-start.sh config/zookeeper.properties启动kafkakafka-server-start.sh config/server.properties停止kafkakafka-server-...
2018-11-29 21:29:50
468

原创 solr部署以及ik中文分词案例
1.简介Solr是一个高性能,采用Java5开发,Solr基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。因为中文的特殊性,在对中文文档建立全文索引时,需要利用分词工具进行分词。目前比较知名的分词工具有:IK,庖丁等.下面使用的是I...
2018-11-24 16:35:09
292

原创 Java使用PDFBox操作PDF文件获取页码、文章内容、缩略图
一、依赖<!--使用的是pdfbox计数总页数与缩略图--><!-- https://mvnrepository.com/artifact/com.sleepycat/je --><dependency> <groupId>com.sleepycat</groupId> <artifactId>......
2018-11-06 22:12:39
6851

原创 hadoop单机伪分布安装HBase-1.4.8详细步骤(亲测成功)
---------前提:安装hadoop、yarn、jdk1.下载解压1.1使用wget下载wget http://archive.apache.org/dist/hbase/1.4.8/hbase-1.4.8-bin.tar.gz 1.2解压到/usr/local目录下tar -zxvf hbase-1.4.8-bin.tar.gzmv hbase-1.4.8 /...
2018-10-23 21:36:10
1869

原创 关于Hadoop的杂乱无章(续更)
hadoopJPS(是jdk的工具):表示查看当前主机有哪些运行的进程NameNode :表示主节点DataNode:表示数据节点SecondaryNameNode :表示次要名称节点--节点表示:一台机器进程是运行在机器上的,一个软件可以有多个进程(分布式软件:Hadoop)HDFS只是Hadoop的一部分,Hadoop还有MR、yarnHDFS是分布式软件系统:将文件自动分布...
2018-09-29 19:55:00
1090

原创 使用CentOS6.8搭建Hadoop集群
概述:集群cluster,能将很多进程分布到多台计算机上;通过联合使用多台计算机的存储、计算资源完成更庞大的任务。为了实现无限量的存储和计算能力,在生产环境中必须使用集群来满足需求。注意事项:1)集群中的计算机在时间上要同步,系统时间不能差太多(约30秒内),如果设置时间后重启时间又不准确了(可能是主板电池老化),可以启用NTP(Network Time Protocol网络时间...
2018-09-29 09:23:28
2350

原创 使用IEDA2018创建maven+web项目
因为是自学,所以走了不少弯路,因此总结一下放置自学的小伙伴们少走弯路,还没有安装IntelliJ IDEA可以点击这里1.版本信息介绍【idea版本】:2018.1.5【Tomcat版本】:7.0.52【maven版本】:3.5.42.软件安装idea的安装与破解可以点击这里Tomcat:安装与启动如下所示运行软件:找到你的tomcat文件路径下的bin(这是我的...
2018-08-15 11:18:23
5192

原创 Idea添加依赖的步骤:
1. 项目按F4(ctrl+shift+alt+s)2. 找到dependencies选项卡3. 点击“ +”4. 将jar包选中,加入5. 可以使用jar中的工具类。网络上下载jar1. 百度搜索 maven repo2. 输入jar包的名字3. 找到对应的版本 下载jar...
2018-07-31 11:17:49
13858
原创 电脑重生之Windows重装系统(草稿)
下载途径:a.微软官网(没有历史老版本) b.三方网站(itellYou)备份数据,一般只需要格式化系统盘即可,其他盘数据无需备份。苹果电脑:自带的bootcamp助理。作用:备份数据、分盘。
2024-12-13 11:18:56
161
原创 linux(redhat8)如何安装mysql8.0之rpm&tar双版本(最新版)(内网)(离线)
如果运行命令之后没有出现任何内容,表示没有安装过mysql,如果有出现,则删除。点击下载按钮弹出下图,点击红框中的连接,跳过登录,直接下载。Java环境:build 1.8.0_181-b13。使用下方的命令进行解压,根据实际安装包名称进行修改。#查看内核版本,根据内核版本下载对应的安装包。如图示,选择对应版本进行下载,此处我的选择是。进入MySQL根目录,直接复制粘贴命令即可。系统版本:Red Hat 8.5.0-20。将压缩包上传至要进行安装的服务器。MYSQL:8.x版本。
2024-11-25 10:08:43
1451
原创 Jdk和Tomcat安装部署文档
回车,如果看到Tomcat自带的一个JSP页面,说明你的JDK和Tomcat已搭建成功。点击应用,重新启动Tomcat.选择jre的路径,点击Next。,避免与其他服务端口冲突。点击Finish安装完成。打开浏览器,在地址栏中输入。点击关闭,安装完成。,点击Install。
2024-11-25 09:33:18
479
原创 Windows之使用putty软件以ssh的方式连接Linux中文显示乱码
运行环境:Windows10使用软件:putty操作说明:以ssh的方式连接Linux 中文显示乱码。
2024-11-22 17:35:38
386
原创 GitLab使用操作v1.0
只有项目创建者有权限更新,我们只能更新自己分支,然后创建合并请求,项目管理者合并到master分支)描述格式:2024/07/16 001-master 添加funddc用户中的脚本 v1.0。Url是第三步查看的[使用http克隆]下面的url –>点击[应用]填写 指派人、审核人,点击[创建合并请求],等待请求合并到,时间 作者 操作类型 具体描述 版本。本地仓库格式:应于远程仓库名称一致。] ,填写自己的分支名称(自己的分支名称:例如。
2024-11-22 17:04:31
590
原创 使用python-Spark使用的场景案例具体代码分析
• 日志分析:互联网公司每天会产生海量的服务器日志,如访问日志、应用程序日志等。Spark可以高效地读取这些日志文件,对数据进行清洗(例如去除无效记录、解析日志格式)、转换(例如提取关键信息如用户ID、访问时间、访问页面等)和分析(例如统计页面访问量、用户访问路径等)。• 数据仓库ETL(Extract,Transform,Load):在构建数据仓库时,需要从各种数据源(如关系型数据库、文件系统等)提取数据,进行清洗、转换和加载到数据仓库中。
2024-11-14 13:11:02
735
原创 从机缘到成就
在撰写博客和文章的过程中,我不得不不断地学习和探索新的技术,这也让我更加深入地理解了编程的本质和思想。除此之外,我还收获了很多粉丝和读者,他们经常给我反馈和评论,这也让我更加有动力和信心继续创作。我也曾面临挫折和疲惫。我不断学习新的知识和技能,积极参与各类技术研讨会和交流活动,这不仅增加了我对技术的深度理解,也拓宽了我的视野与见识。在这1825天的旅程中,我找到了自己的方向,也收获了许多宝贵的机遇和成长。我的技术博客逐渐积累了一定的粉丝和读者群体,他们通过评论和邮件与我互动,给我提供了更多的反馈和建议。
2023-06-19 17:16:48
298
原创 离线计算调优手册
目前离线计算主要分为两块: 和 ,该手册将围绕这两部分展开说明。随着技术不断迭代升级,结合不同业务、不同场景,手册的适用性可能发生变化,因此下面介绍的优化手段可作为参考,并不是一成不变的。Hive的简单定义(来自Hive官网):简单来说,hive本身是一种数据仓库,通过其提供的sql和访问接口,使我们能够很方便的访问读写大规模数据集,无需关注底层数据是如何分布存储的。目前hive 提供了三种计算引擎:,使用者可根据hadoop集群安装环境(CDH、阿里云EMR等等)选择使用不同的计算引擎。具体可通过参数
2023-06-13 23:23:58
580
FFReader-Win-V1.9.16-64Bit
2024-11-19
smbMount fstab去除cifs明文挂载信息变更手册
2024-11-18
dbf2csv.rar
2019-07-25
MobaXterm是Windows全能终端神器
2018-10-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人