卡莫纳王牌枪神-优快云博客

原创 HIVE3.X版本讲解与部署

将MySQL的JDBC驱动拷贝到Hive的lib目录下：（/opt/software）（可能在其它地方，例如在（sqoop））初始化Hive元数据库（修改为采用MySQL存储元数据）:（/opt/module/hive）初始化Hive元数据库（修改为采用MySQL存储元数据）:（/opt/module/hive）初始化Hive元数据库（修改为采用MySQL存储元数据）:（/opt/module/hive）初始化Hive元数据库（修改为采用MySQL存储元数据）:（/opt/module/hive）

2024-11-12 14:33:08 2942

原创 HIVE安全配置

Hive审计是一款基于数据库通讯协议准确分析和SQL完全解析技术的数据库安全审计系统。它实现了对数据库操作、访问用户及外部应用用户的全面、准确、高效的监控和审计追踪，可以用于安全合规、用户行为分析、运维监控、风控审计、事件追溯等与数据库安全相关的管理活动。

2024-11-11 09:21:00 1740

原创 Flink讲解与部署与yarn模式

Flink提供了多种状态后端来存储和管理状态，并支持不同的状态模式，如ValueState、ListState、ReducingState等。：随着大数据和实时数据处理需求的增长，Flink不断发展，引入了许多扩展功能，如复杂事件处理、图计算、机器学习等。：Flink支持构建事件驱动的应用程序，可以处理来自各种源的事件，如消息队列、日志文件等。：Flink支持构建事件驱动的应用程序，可以处理来自各种源的事件，并基于事件时间进行处理。：Flink专为实时数据处理设计，能够以极低的延迟处理无界数据流。

2024-11-08 11:29:58 1446

原创 Hbase讲解与安装与配置部署

HBase是一个分布式的、面向列的开源数据库，它是Apache Hadoop项目的子项目。HBase的技术来源于Fay Chang所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。HBase在Hadoop之上提供了类似于Bigtable的能力，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。：HBase采用了自动故障检测和恢复技术，可以实现数据的高可靠性。：HBase采用了基于Memcached的存储引擎，可以实现高速的读写操作。

2024-11-07 09:53:05 2466

原创事务-并发事务演示及隔离级别：

查询结果：SELECT @@TRANSACTION_ISOLATION;查询结果：SELECT @@TRANSACTION_ISOLATION;2.--设置事务隔离READ UNCOMMITTED级别。3.--设置事务隔离REPEATABLE READ级别。1.--查看事务隔离级别。--查看事务隔离级别。--设置事务隔离级别。

2024-11-16 10:04:37 332

原创 MYSQL-double

在MySQL中，DOUBLE是一种用于存储双精度浮点数的数据类型。它用于表示需要较大范围和较高精度的数值数据。以下是一些关于DOUBLE。

2024-11-15 11:28:36 718

原创 MySQL事务的四大特性ACID

MySQL事务的四大特性ACID，即原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持久性（Durability），是确保数据准确性和可靠性的关键所在。

2024-11-14 09:07:47 285

原创 hadoop-teragen库的使用

hadoop jar /opt/module/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.4.jar（使用的jar包的路径） teragen 10000000 （使用代码） /teragen/data（存放结果的hdfs路径）创建hdfs路径(注意不要创建teragen库的指定存放路径否则会报错)（前置安装hadoop jdk并完成安装配置部署）查询结果(随机生成的数，这样的数据没有问题)检查路径是否成功创建。

2024-11-14 08:59:08 945 1

原创物联网常见设备故障原因

目录一、硬件故障二、软件问题三、网络问题四、配置与兼容性问题五、环境因素。

2024-11-13 10:00:00 584

原创 windows安全策略讲解

Windows安全策略主要包括本地安全策略和域策略两部分。本地安全策略是针对单个计算机的安全设置，通过本地组策略编辑器进行配置。而域策略则提供集中管理和配置整个域中计算机的安全设置的方式，通过Group Policy Objects（GPOs）进行配置。

2024-11-13 09:53:39 1363

原创物联网六域模型与三层体系讲解

网络层通过有线网络（如拨号网络、局域网络、私有网络、专线网络）和无线网络（如2G、3G、4G、WLAN、WiMax等）实现信息的无障碍、高可靠性、高安全性的传送。物联网三层体系架构通过感知层、网络层和应用层的协同工作，实现了物理世界与虚拟世界的深度融合，推动了物联网技术的快速发展和广泛应用。物联网六域模型为整体物联网系统提供了一个具体的架构框架，使得不同领域的开发人员能够更好地协同工作，提高物联网系统的整体性能和可信度。随着物联网的发展和应用越来越广泛，六域模型将为物联网的研究和开发提供一个重要参考。

2024-11-12 19:06:27 1682

原创大数据选举机制的讲解

：数据质量和真实性：数据完整性和代表性：数据时效性和解释性：隐私和伦理问题：技术限制和成本：

2024-11-12 18:48:23 930

原创大数据理论

大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

2024-11-12 14:20:09 463

原创 pyspark的讲解与差异性

PySpark是Spark的Python类库，内置了完全的Spark API。PySpark基于Python语言开发，但仅支持在单机环境下供Python用户开发调试使用，需要将程序提交到Spark集群上才能使用Spark集群分布式的能力处理大规模的数据处理任务。总之，PySpark作为一款强大的大数据处理工具，以其高效性、易用性和丰富的功能，受到了越来越多开发者的青睐。通过掌握PySpark的核心概念和组件，结合实际应用场景，我们可以更好地应对大数据处理挑战，挖掘数据价值，为业务发展提供有力支持。

2024-11-11 14:29:53 972

原创 HIVE安装配置部署常见的问题大全

为了避免这些问题，建议在部署Hive之前仔细阅读官方文档，了解Hive的依赖关系和配置要求，并遵循官方推荐的安装和配置步骤进行操作。为了避免这些问题，建议在部署Hive之前进行充分的规划和测试，并持续关注官方文档和社区动态以获取最新的支持和解决方案。为了确保Hive系统的稳定运行和高效性能，建议用户在部署和使用Hive时充分考虑这些问题，并采取相应的措施进行预防和解决。除了之前提到的Hive安装配置部署中常见的问题外，还有一些其他可能遇到的问题，这些问题同样需要关注和解决。

2024-11-11 09:07:34 1017 2

原创 HIVE架构调优讲解

Hive的体系结构可以分为用户接口、元数据存储、解释器/编译器/优化器、执行引擎和数据存储等几个主要部分。用户接口包括CLI、JDBC/ODBC和Web UI，用于提交查询和查看结果。元数据存储负责存储Hive的元数据，如表名、列名、分区信息等。解释器/编译器/优化器负责将HQL查询语句转换为执行计划。执行引擎则负责执行计划的具体执行，通常调用MapReduce或Spark等计算框架。数据存储则位于HDFS中，Hive中的数据以表、分区和桶的形式组织。

2024-11-08 10:30:18 947

原创 HDFS进阶操作

hdfs dfs -put -p /opt/data/bigdata.txt(linux路径) /user/data/putdata(hdfs路径)（新用户:新用户组）（目标文件hdfs路径）-p是为了保留属性 (意思就是执行上传命令后继续保持原有的属性)755权限）（目标文件hdfs路径）保留访问和修改时间，所有权和权限。如何hdfs上传文件时候，更改。访问和修改时间，所有权和权限。如何hdfs上传文件时候，修改所有权和权限的语法。

2024-11-07 08:33:54 391

原创 Zookeeper安装配置部署（讲解与操作）

ZooKeeper的数据模型结构与Unix文件系统很类似，整体上可以看作是一颗树，每一个节点称做一个ZNode。：ZooKeeper中的节点有两种类型，一种是临时节点，另一种是永久节点。解压zookeeper：（zookeeper安装包路径：/opt/software）在tmp中添加文件：（/opt/module/zookeeper/tmp）修改配置文件：（/opt/mouble/zookeeper/conf）新建文件夹：（/opt/module/zookeeper）改名：（/opt/module）

2024-11-06 11:20:41 1004

原创 HIVE解决存储文件类型为“Parquet”，并启用行级压缩

设置 Parquet 压缩：你可以在创建表时通过 STORED AS PARQUET 语句和 TBLPROPERTIES 来设置压缩算法。

2024-11-06 08:57:38 602

原创 MySQL用户操作

创建新用户Hadoop 并设置密码（示例）（密码开始的时候设复杂点，在改回123456）

2024-11-06 08:31:00 242

原创 MySQL解决如何修改用户名问题

例如:更改master用户名为root，master用户为%，既是所有主机都能连接（localhosts为%）（在mysql里操作）例如:更改root用户名为master 允许连接的节点是10.7.242.225。例如:更改root用户名为master 允许连接的节点是%（所有主机）（在mysql里操作）

2024-11-05 21:48:18 405

原创 Pandas （快乐的七天学习之路）第一天

2.6-2.7从DataFrame中查询出Seriesa等...2.9查询多行，结果是一个pd.DataFram...2.5 根据多个字典序列创建dataframe.py。2.8 查询一行，结果是个pd.Series.py。2.1仅有数据列表即可产生最简单的Serie...2.3 使用Python字典创建Series.py。2.2创建一个具有标签索引的Series.py。2.4根据标签索引查询数据py。

2024-11-05 21:37:46 167

原创 MySQL在sql里玩编程

{这里，用户定义的变量@result来接收存储过程的输出。调用存储过程myShu时，我们传入了一个整数5作为输入参数，并指定了@result作为输出参数的接收者。然后，我们使用SELECT语句来查看@result的值，它应该显示“输出5是奇数”。

2024-11-05 20:09:58 197 1

原创 Python快乐的四天路途#第一天

Python快乐的四天路途#第一天。

2024-11-05 19:25:37 281 1

原创 MySQL密码更改方案

通过更改配置文件和sql语句来进行更改mysql用户密码

2024-11-05 18:51:49 219

原创 MySQL表格优化命令与讲解

对于大型数据库，通过表拆分（如水平拆分和垂直拆分）等技术，可以将数据分散到多个表或数据库中，从而降低单一表的负载，提升数据库的并发处理能力。使用ANALYZE TABLE和OPTIMIZE TABLE等命令，可以分析和优化表的索引和存储结构，进一步提高查询性能。通过删除不必要的数据、压缩数据或使用更高效的数据类型，可以减少表占用的存储空间，提高存储资源的使用效率。优化的表结构可以提高数据库的可靠性和稳定性，减少因性能问题导致的系统崩溃和数据丢失等风险。1.对表格进行优化(重点，核心语句)

2024-11-05 17:35:55 395 1

原创 snownlp 情感分析

提取文本摘要s = SnowNLP(u'SnowNLP类似NLTK，是针对中文处理的一个Python工具库。使用简单、功能强大。u'可以实现包括中文分词、词性标注、情感分析等在内的功能。是中文语言处理研究者不可多得的研究工具。u'工具库参考了TextBlob的文档结构，对新手使用者相当友好...')'''limit: 类型为int，默认值为5，表示提取的摘要分句数量'''"""['是针对中文处理的一个Python工具库', '可以实现包括中文分词、词性标注、情感分析等在内的功能']"""

2024-11-05 16:50:37 142

原创 HADOOP本地模式与yarn模式之间的区别

(/$HADOOP_HOME/etc/hadoop/mapred-site.xml)(/$HADOOP_HOME/etc/hadoop/mapred-site.xml)(/$HADOOP_HOME/etc/hadoop/mapred-site.xml)

2024-11-05 16:17:27 191

原创 HADOOP jobhistory配置与部署

查看端口浏览器：http://master的ip:19888。查看端口浏览器：http://master的ip:10020。启动：在hadoop/sbin的目录下执行。

2024-11-05 16:08:05 282

原创 HADOOP 3.X伪分布式搭建

修改配置文件：（/opt/mouble/hadoop/etc/hadoop）解压hadoop：（/opt/software）自己将格式对齐，不然会报错）改名：（/opt/mouble）（开启时自动关闭防火墙）检查集群：（所有节点）

2024-11-05 15:50:49 204

原创 HADOOP2.x伪分布式集群搭建

systemctl disable firewalld（开启时自动关闭防火墙）修改配置文件：（/opt/mouble/hadoop/etc/hadoop）systemctl stop firewalld（关闭防火墙）firewall-cmd --state（查询防火墙状态）请注意自己的路径和主机名！如果不同命令就会报错。解压hadoop：（/opt/software）vi mapred-env.sh（注释的）vi yarn-env.sh（注释的）改名：（/opt/mouble）检查集群：（所有节点）

2024-11-05 15:43:48 215

原创 HDFS-操作

hdfs操作大全

2024-11-05 15:29:55 1007

原创解决linux将csv连入mysql数据库的问题

解决linux将csv连入mysql数据库的问题。

2024-11-05 11:57:29 302

原创 MySQL出现字符串报错的解决方式大全(通用)

如果问题仍然存在，请确保你检查了所有相关的配置和代码，并考虑在MySQL社区或相关的技术论坛上寻求帮助。确保你的数据插入语句中的中文字符串没有因为编码问题而被破坏。如果你是从外部文件或应用程序中读取数据并插入到MySQL中，请确保这些数据的编码与MySQL服务器的字符集相匹配。查看MySQL服务器的配置文件（通常是my.cnf或my.ini），确保[client], [mysql], [mysqld]部分都设置了正确的字符集和排序规则。当你连接到MySQL服务器时，确保你的连接也使用了正确的字符集。

2024-11-05 11:49:35 754 1

平台搭建和python操作，hdfs操作等

二手房数据挖掘与分析（python）

二手房数据挖掘与分析（python）

数据可视化大屏（超市数据分析与可视化）

HIVE2.3.4版本在HADOOP3.2.4版本部署中存在hive功能不齐全