- 博客(2438)
- 资源 (19)
- 收藏
- 关注
原创 利用Docker-Compose部署MySQL服务器
本实战通过 Docker Compose 部署 MySQL 8.0 容器,配置端口映射、字符集、大小写不敏感及数据持久化,利用 Navicat 连接并验证数据库操作;通过 docker-compose down 与 --volumes 参数对比演示了数据卷的保留与清除机制,完整展示了容器化数据库的部署、管理与数据持久化特性。
2025-12-04 18:24:08
614
原创 7.1 Hive内置函数
本次 Hive 内置函数实战全面覆盖数学、日期、字符串、条件、聚合及集合统计等类别,通过大量示例验证了函数在数据清洗、转换、分析中的强大能力。重点掌握了 `collect_set` 与 `collect_list` 在去重与保留重复场景下的差异应用,熟练运用 `regexp_replace`、`parse_url`、`get_json_object` 等函数处理非结构化数据,并通过 `percentile`、`var_pop` 等实现统计分析。
2025-12-03 13:42:42
336
原创 实训云上搭建大数据集群
本次实战围绕云主机搭建与大数据集群服务展开。历经登录实训云、创建网络、路由器、虚拟网卡等基础配置,设置安全组规则并创建云主机,绑定浮动IP实现FinalShell远程连接。通过修改本地IP与主机名映射文件,实现按IP及主机名Ping云主机。
2025-12-03 08:25:30
933
原创 任务4-4 操作数据表的数据
通过本次实战,我们完成了宠物店数据库的创建、数据插入、修改和删除操作。从表结构设计到数据完整性约束的建立,再到数据的增删改查,全面掌握了数据库操作技能。这些操作确保了数据的准确性与一致性,为宠物店的信息化管理提供了坚实基础。
2025-12-01 21:14:36
391
原创 7.2 Hive自定义函数实战
本实战完整演示了 Hive 自定义函数(UDF)的开发与部署流程:从创建 Maven 项目、编写阶乘 UDF 类,到打包上传 JAR;分别注册临时函数和永久函数,并验证其生命周期与可用性。通过对比,明确了临时函数会话级有效、永久函数全局持久的特点,掌握了 UDF 在生产环境中的正确使用方式。
2025-11-30 14:49:04
270
原创 6.5 Hive查询优化:执行计划与性能初探
本次实战通过 explain 命令分析了三类典型查询的执行计划:普通表全表扫描、多表 JOIN 优化及分区表裁剪效果。验证了谓词下推、MapJoin 和分区裁剪等 Hive 自动优化机制的实际生效情况,直观展示了合理使用分区字段与小表关联对减少 I/O、提升性能的关键作用。
2025-11-28 12:16:45
256
原创 6.4 Hive高级分析:窗口函数与复杂查询
本次实战基于 student、sc 和 course 三张真实表,运用窗口函数完成了课程内成绩排名、按年龄分组平均分计算、以及学生个人最高分差距分析等高级查询,充分展示了窗口函数在保留明细数据的同时实现高效分组统计与对比的能力,验证了其在教育数据分析场景中的实用性与灵活性。
2025-11-28 11:33:47
296
原创 6.3 Hive多表关联:JOIN与子查询
本次实战基于学生、课程与选课三张表,系统演练了 Hive 中 JOIN 多表关联与子查询的典型应用,包括成绩查询、条件筛选、选课统计等场景,验证了关联查询的数据整合能力与子查询在聚合过滤中的灵活性,为复杂分析任务奠定基础。
2025-11-28 09:45:09
333
原创 6.2 Hive分组统计:GROUP BY与聚合函数
本次实战围绕 Hive 的 GROUP BY 与聚合函数展开,基于学生表 t_student 进行多维度分组统计,包括按性别、年龄统计人数,使用 HAVING 筛选分组结果,并计算各性别的平均、最大和最小年龄,全面展示了分组聚合在数据汇总与分析中的核心应用。
2025-11-27 11:48:57
344
原创 6.1 Hive基础查询:SELECT与WHERE
本次实战围绕Hive基础查询展开,通过学生表和雇员表,演示了SELECT与WHERE的多种用法,包括全表查询、数值/字符串条件过滤、范围查询(BETWEEN)、集合查询(IN)、模糊匹配(LIKE)及复杂字段(如struct类型)处理,验证了HiveQL在结构化数据检索中的灵活性与高效性。
2025-11-27 10:51:48
247
原创 Hive实战 - 词频统计
本次Hive词频统计实战通过创建外部表读取HDFS文本数据,利用explode(split(...))拆分单词并构建视图,实现基于视图的分组计数与排序,完整展示了从数据加载、单词展开、视图封装到词频统计的全流程,并通过脚本自动化执行及元数据验证,体现了Hive在文本分析中的高效性与灵活性。
2025-11-27 07:56:42
293
原创 4.6 Hive视图实战
本次实战通过创建课程表并基于其定义视图 v_course,完整演示了 Hive 视图的创建、查询、元数据验证与删除操作,验证了视图作为虚拟表的动态查询能力、逻辑抽象优势及其在简化访问和权限控制中的应用价值。
2025-11-27 07:52:31
161
原创 4.5 Hive临时表实战
本次实战通过创建临时表 t_course,演示了 Hive 临时表的创建、数据插入、查询及生命周期管理。验证了其仅在当前会话可见、不写入元数据、会话结束后自动删除的特性,适用于 ETL 中间处理与临时数据缓存场景,提升开发效率并避免元数据污染。
2025-11-27 07:48:53
279
原创 4.4 Hive分桶表实战
本实战通过创建外部表加载课程数据,构建按 course 字段分3桶的内部分桶表,开启分桶机制后插入数据,验证HDFS中数据按哈希值分布至各桶,并通过分桶采样查询展示其在高效抽样与数据组织中的优势,完整体现了Hive分桶表的核心功能与应用场景。
2025-11-27 07:44:15
272
原创 4.3 Hive分区表实战
本次实战围绕Hive分区表展开,分别完成单分区(按国家)和多分区(按省、市)表的创建、数据加载、查询验证及元数据管理。通过手动操作与自动同步,深入掌握分区增删改查、HDFS存储结构及Metastore元数据关联机制,充分体现了分区表在提升查询效率与数据组织方面的核心优势。
2025-11-27 07:39:56
373
原创 任务4-3 数据完整性约束
在 schooldb 中依次完成主键、唯一、外键与 CHECK 四大完整性实战:建 student、course 表并设单列/联合主键,book2 表加 UNIQUE 替代键;sc 表以双外键关联,ON DELETE CASCADE 自动清理选课记录;最后用 CHECK 限定学分 1–10、性别年龄范围,违规插入及更新均被拦截,再演示删除约束恢复写入,实现域、实体、参照完整性全覆盖。
2025-11-26 21:38:49
656
原创 任务4-2 创建和维护数据表
命令行建 bookstore 库,用 CREATE TABLE 按业务设计生成含主键、默认值、引擎 InnoDB 的 book 表;SHOW/DESCRIBE 查看清单与结构。通过 ALTER 增删浏览次数、调整类型默认值,演练 LIKE 与 SELECT 三种复制模式,完成 book1~book3 结构+数据克隆,最后 DROP 多表清理,实现表生命周期全流程维护。
2025-11-26 21:35:28
113
原创 任务4-1 了解MySQL的数据类型
MySQL 数据类型分三大纲:数值、字符串、日期时间。数值又分整型与实型:整型从 tinyint 到 bigint,字节与范围递增,主键计数常用 int/bigint;实型 float/double 供浮点运算,decimal 定点保财务精度。字符串 char 定长补空格,varchar 变长省空间,blob/text 系列分别存二进制与长文本,按规模分 TINY/MEDIUM/LONG 四级。
2025-11-26 21:32:17
116
原创 任务3-2 使用图形化工具创建和管理数据库
在 Navicat 中新建 MySQL 连接并测试连通;右击创建 schooldb 库,双击打开,图形化修改字符集与校对规则;右键关闭、再删除库,最后关闭并移除连接,全程无命令,完成数据库生命周期可视化管控。
2025-11-26 21:28:14
445
原创 任务3-1 使用命令创建和管理数据库
用 CREATE DATABASE 建 Bookstore、Petstore,体验 IF NOT EXISTS 防错与 CHARACTER/COLLATE 设置;USE 切换当前库,SHOW CREATE 看属性,ALTER 修改字符集,SHOW DATABASES 罗列全部,DROP 删除库并二次确认,全程命令行完成数据库生命周期管理。
2025-11-26 21:24:26
247
原创 任务 2-2 图形化管理工具Navicat
安装并激活 Navicat 后,新建 MySQL 连接,可视化完成 test 库与 student 表的建删改。用查询窗口执行 SQL,一次性插入三条记录,练习条件查询、更新、删除及表库清理,全程通过图形菜单与命令双模式操作,实现高效图形化数据库管理实战。
2025-11-26 21:20:16
130
原创 任务 2-1 搭建MySQL使用环境
全程在 Windows 平台完成 MySQL 8.0 的下载、Full 完全安装与默认配置,设定 root 及 huawei 用户并启动系统服务。通过 MySQL Shell 逐条演练:建 test 库、student 表,插入、查询、更新、删除记录及字段匹配,最后清理表与库。随后用 MySQL Workbench 新建连接、保存密码、测试连通,并在可视化查询窗口重复执行 show 语句,实现命令行与图形界面双重验证,完成本地开发环境的搭建与基本 CRUD 实战。
2025-11-26 21:16:35
488
原创 任务1-1 了解数据库基础知识
数据是记录客观事物的可识别符号,分结构化(表)、半结构化(XML/JSON)与非结构化(文本、媒体)。数据库管理系统据此分关系型与非关系型两类:前者以MySQL、Oracle、SQL Server为代表,用表存储,事务强一致;后者含Redis内存键值、MongoDB文档、HBase列式,水平扩展、海量高并发,共同构成现代数据生态。
2025-11-26 21:12:12
200
原创 重置Hive环境
本次实战完成了Hive环境的彻底重置与重建:包括清理HDFS数仓目录、停止并重启Hadoop服务、清除旧Hive元数据库、重新初始化Metastore、启动Hive服务进程,并验证了Hive与MySQL元数据的一致性,为后续数据仓库开发提供了干净可靠的运行环境。
2025-11-26 13:32:21
1016
原创 Docker实战 - 将Web项目打成war包部署到tomcat容器里运行
本实战通过 Docker 容器化部署 SimonShop 电商项目:基于自定义 Tomcat 和 MySQL 镜像,创建数据库并导入脚本,修改 Web 项目连接地址为 host.docker.internal:3307,打包 WAR 文件挂载至容器,成功实现用户登录与商品浏览功能,验证了容器间通信及 Web 应用正常运行。
2025-11-21 18:24:28
1138
1
原创 5.5 Hive导出数据实战
实战演练涵盖了从ACID与非ACID表中导出数据至HDFS或本地的多种场景,包括使用适当语法格式处理大数据量的分布式存储和单机小数据量调试。任务成功验证了从非ACID表t_student导出男生记录至HDFS,以及t_student_acid表女生记录到本地的流程,同时指出直接从ACID表导出数据至HDFS的限制。通过MapReduce作业实现数据导出,并检查输出文件确认数据完整性和正确性,体现了Hive在数据处理和导出方面的灵活性与强大功能。然而,对于ACID表的数据导出,需采用其他策略以避免事务一致性问
2025-11-21 11:18:02
417
原创 5.4 Hive删除数据实战
本实战演示了在Hive ACID表中执行DELETE操作的完整流程:通过配置事务参数,对已存在的`t_student_acid`表执行删除语句,成功移除“王小虎”记录,并经查询验证数据一致性。整个过程符合ACID特性,体现了Hive对行级删除的支持及事务可靠性。
2025-11-21 10:23:39
362
原创 5.3 Hive更新数据实战
本实战演示了在Hive中基于ACID事务机制更新数据的完整流程:通过配置事务参数、创建ORC分桶ACID表、插入初始数据,并成功使用UPDATE语句将“李灵玉”的年龄修改为18岁,验证了Hive对行级更新的支持及数据一致性保障。
2025-11-21 09:55:12
377
原创 宿主机和虚拟机访问Docker容器里的MySQL
本次实战围绕Docker容器化MySQL展开,在openEuler虚拟机中拉取MySQL 8.0镜像并创建容器,完成数据库、表的创建及数据插入。通过授权配置,实现了虚拟机本地及Windows宿主机(Navicat)对容器内MySQL的跨主机访问,验证了Docker容器化应用的便捷性与可访问性。
2025-11-20 23:37:29
1136
1
原创 Ubuntu24.04上为Docker配置华为镜像加速器
本次实战完成了 Docker 环境的验证与优化:通过 `docker version` 和 `hello-world` 测试基础功能,配置华为云镜像加速器提升拉取效率,重启服务后验证配置生效,并成功拉取 MySQL 镜像,为后续容器化应用部署奠定稳定高效的环境基础。
2025-11-20 15:56:16
961
原创 5.2 Hive插入数据实战
本次实战系统演示了 Hive 3.1.3 的插入数据操作,涵盖非分区表的追加与覆盖插入、分区表的静态与动态分区写入。通过临时表生成测试数据,验证了 `INSERT INTO` 和 `INSERT OVERWRITE` 的行为差异,并成功实现按区域自动创建分区及分区级数据清洗,全面掌握基于查询的批量数据写入机制及其在 ETL 中的应用。
2025-11-20 11:40:29
385
原创 5.1 Hive加载数据实战
本次实战系统演示了 Hive 3.1.3 中加载数据的完整流程,包括创建内部表与分区表、从本地和 HDFS 加载数据、验证文件存储与查询结果。通过 LOAD DATA 实现高效文件级导入,验证了内部表的数据移动/复制行为及分区表的目录结构与分区裁剪机制,全面掌握 Hive 数据加载核心操作。
2025-11-20 11:37:13
424
原创 Docker Desktop设置华为镜像加速器
本次实战演示了在 Windows 系统下通过 Docker Desktop 配置华为云 SWR 镜像加速器的完整流程,包括查看 Docker 版本、获取并设置镜像加速地址、验证配置生效,并成功拉取 MySQL 镜像,有效解决国内拉取 Docker Hub 镜像慢或失败的问题。
2025-11-19 18:17:54
1049
原创 4.2 Hive数据表操作
本次Hive实战围绕数据库与表的创建、数据插入(命令/文件上传/LOAD)、复杂类型查询及元数据管理展开,验证了内部表存储机制、分隔符处理、中文支持及SQL查询能力,全面掌握了Hive数据仓库的核心操作流程与底层原理。
2025-11-13 17:15:31
449
原创 4.1 Hive数据库操作
本次实战系统演示了Hive数据库的全生命周期管理:从启动MySQL、Hadoop及Hive服务,到创建、查询、切换、修改和删除数据库,涵盖默认与自定义路径、属性设置、所有者变更及级联删除等核心操作,全面掌握Hive元数据管理技能。
2025-11-13 13:07:17
320
原创 在IPython和PyCharm里通过PySpark实现词频统计
本次实战围绕 PySpark 的本地与远程开发环境搭建及词频统计应用展开。通过在虚拟机中配置 IPython 并结合 findspark 与 pyspark 库,分别使用 RDD 和 Spark SQL 实现了对本地及 HDFS 文件的词频统计;同时,在宿主机 PyCharm 中远程连接虚拟机,完成相同功能的脚本开发与运行,验证了 PySpark 在不同开发模式下的灵活性与一致性。
2025-11-11 20:36:09
1511
原创 Python循环嵌套实战 - 智能地铁调度模拟系统
本项目通过 `while`(时间推进)与 `for`(车厢/站点遍历)嵌套,模拟地铁列车在多站间往返运行,动态处理乘客上下车、高峰期客流、车厢容量限制等逻辑,实现调度过程可视化与数据统计,强化循环结构实战应用。
2025-11-11 13:22:49
669
原创 Spark3.3.2上用PySpark实现词频统计
本实战基于 Spark 3.3.2 与 Python 3.7.7,通过统一集群 Python 环境并上传文本至 HDFS,分别使用 RDD 和 Spark SQL 两种方式实现词频统计。前者通过函数式算子链完成分词、计数与排序,后者借助 DataFrame 与 SQL 语句实现声明式分析,全面展示了 PySpark 批处理的核心编程范式与实践流程。
2025-11-09 18:45:24
1484
1
原创 视觉信息如何被大脑处理?
视觉信息从视网膜经外侧膝状体传至初级视觉皮层(V1),再通过腹侧通路(V2→V4→PIT→AIT)完成物体识别;前额叶皮层(PFC)参与决策,前运动皮层(PMC)与运动皮层(MC)协同发出动作指令,整个过程约在200毫秒内完成。
2025-11-09 13:37:14
659
原创 HBase Shell里表操作实战
本实战基于 HBase 2.6.3(运行于 JDK 17),完整演示了从启动集群、创建表、写入与查询数据,到修改、删除及最终删除表的全流程操作,涵盖了 HBase Shell 的核心命令,验证了 HBase 作为分布式列式数据库的基本功能与使用方法。
2025-11-07 13:55:26
912
Spring Boot综合项目实战 - 西蒙购物网(源码+数据库脚本)
2025-10-10
西蒙购物网是基于 Jakarta EE 的 Java Web 综合实训项目:源码+文档+数据库脚本
2025-10-10
【云计算与容器技术】基于openEuler的Docker CE 26.1.3安装实践:国产系统下容器环境部署与验证全流程解析
2025-10-10
【大数据技术】基于MySQL的Hive本地模式安装配置:元数据管理与HDFS数仓部署方案设计
2025-10-10
【云计算与大数据】云上集群搭建及远程管理:基于实训云平台的大数据环境部署与Hadoop服务操作
2025-10-10
【数据库技术】MySQL8.0.35安装配置指南:Windows环境下完整部署与CSV数据导入操作手册
2025-10-10
第二阶段实训:基于媒体库音乐播放器V1.0
2018-02-09
第三阶段实训项目:基于网络乐库音乐播放器V1.0
2018-02-09
采用多种方式实现词频统计
2018-02-09
学生信息管理系统(MySQL版)V1.0源码.rar
2021-01-08
学生信息管理系统(MySQL版)V1.0.rar
2019-08-21
VB版学生成绩管理系统V1.0源码.rar
2021-01-08
贪吃蛇游戏V1.0源码_贪吃蛇游戏源代码
2021-01-08
基于网络乐库音乐播放器V1.0源码.rar
2021-01-10
基于媒体库音乐播放器V1.0源码.rar
2021-01-10
MSMusicPlayerV1.0.rar
2019-08-21
boot_thymeleaf_demo.rar
2019-08-21
boostrap_demo.rar
2019-08-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅