
数据分析
文章平均质量分 75
数据分析
北海屿鹿
越努力,越幸运
展开
-
TreeSize:免费的磁盘清理与管理神器,解决C盘爆满的燃眉之急
假如你买了一台新电脑,随着时间的推移,你注意到电脑启动变慢,程序响应也不如以前迅速,打开“我的电脑”,发现C盘的可用空间已经低于10%。那么不用怀疑,就是因为你的C盘空间爆满导致的系统运行缓慢、应用程序性能下降、电脑启动变慢,严重甚至会导致频繁的系统崩溃或者蓝屏。可是你并不知道C盘为什么爆满,你平时下载软件都是下载到其他驱动盘,C盘为什么“日渐丰满”呢?原创 2025-04-01 10:00:32 · 856 阅读 · 0 评论 -
【MySQL】事务(中)
其中隔离级别越严格,安全性越高,但数据库的并发性能也就越低,往往需要在两者之间找一个平衡点。不可重复读的重点是修改和删除:同样的条件, 你读取过的数据,再次读取出来发现值不一样了幻读的重点在于新增:同样的条件, 第1次和第2次读出来的记录数不一样说明: mysql 默认的隔离级别是可重复读,一般情况下不要修改上面的例子可以看出,事务也有长短事务这样的概念。事务间互相影响,指的是事务在并行执行的时候,即都没有commit的时候,影响会比较大。原创 2025-03-21 09:40:17 · 797 阅读 · 0 评论 -
MongoDB 数据库备份和恢复全攻略
在当今数据驱动的时代,数据库的稳定运行和数据安全至关重要。MongoDB 作为一款流行的 NoSQL 数据库,以其灵活的文档模型和高扩展性备受青睐。然而,无论数据库多么强大,数据丢失的风险始终存在,因此掌握 MongoDB 的备份和恢复方法是数据库管理的关键环节。本文将深入探讨 MongoDB 的备份和恢复策略,帮助你更好地保护数据资产。原创 2025-01-24 09:45:46 · 648 阅读 · 0 评论 -
介绍 Apache Spark 的基本概念和在大数据分析中的应用
它支持批处理、流处理、机器学习和图计算等多种场景,并且提供了丰富的API和库来简化大数据处理的复杂性。:RDD是Spark的核心数据结构,它是一个可并行操作的、可变的、容错的分布式集合。它支持常见的流处理操作,如窗口计算、累加器、状态管理等,可以用于实时监控、实时报警等场景。:Spark提供了丰富的转换操作,如map、filter、reduce等,用于对RDD进行转换和操作。Spark的设计目标是为了提高大数据处理的速度和灵活性。它提供了丰富的转换和行动操作,可以方便地进行数据清洗、聚合、过滤等操作。原创 2024-03-06 10:46:04 · 388 阅读 · 2 评论 -
【jupyter notebook】
运行本单元,在其下插入新单元。:单元转入markdown状态。: 运行本单元,选中下个单元。: 中断Notebook内核。: 重启Notebook内核。: 恢复删除的最后一个单元。: 单元转入raw状态。: 单元转入代码状态。: 设定 1 级标题。: 设定 2 级标题。: 设定 3 级标题。: 设定 4 级标题。: 设定 5 级标题。: 设定 6 级标题。: 扩大选中上方单元。: 扩大选中下方单元。: 在上方插入新单元。: 在下方插入新单元。...原创 2022-09-01 08:55:07 · 390 阅读 · 0 评论