
大数据
文章平均质量分 65
大数据 学习
程序员食堂
一个写了10多年bug的程序员。
展开
-
数据脱敏学习
数据脱敏是一种保护敏感信息的方法,它通过修改或删除数据中的敏感部分,使得数据在保持一定可用性的同时,不再直接关联到个人隐私或重要信息。直接标识:如姓名、身份证号码、家庭住址、电话号码、电子邮件地址、护照号码、社会安全号码(或等效物)、驾驶执照号码等。间接标识:如位置数据、在线身份识别(如IP地址)、Cookie、DNA样本、指纹等。其他因素:与个人的物理、生理、遗传、心理、经济、文化或社会身份相关的特定因素。原创 2024-06-28 15:28:14 · 972 阅读 · 0 评论 -
大数据—元数据管理
在大数据环境中,元数据管理是确保数据资产有效利用和治理的关键组成部分。元数据是描述数据的数据,它提供了关于数据集的上下文信息,包括数据的来源、格式、结构、关系、质量、处理历史和使用方式等。有效的元数据管理有助于提高数据的可发现性、可理解性和可信度,从而支持更好的数据驱动的决策制定。原创 2024-06-04 05:00:00 · 840 阅读 · 0 评论 -
大数据数据治理工具
一个开源的数据治理和元数据框架,为Hadoop生态系统提供数据分类、管理和安全功能。一个统一的数据治理服务,帮助组织管理数据资产、扫描数据、分类数据并确保合规性。提供全面的数据治理解决方案,包括数据质量、元数据管理、数据隐私和合规性监控。一个数据智能平台,提供数据目录、数据治理、数据质量和数据隐私管理功能。提供数据发现、数据管道、数据治理和多云管理功能,支持企业级数据管理。一个开源的数据质量检测和文档工具,用于确保数据管道中的数据质量。一个集成平台,提供数据质量、数据集成、数据治理和大数据处理功能。原创 2024-06-04 05:00:00 · 620 阅读 · 0 评论 -
大数据数据治理
大数据数据治理是一个复杂的过程,涉及到数据的标准化、融通、关联、解析、聚合等一系列活动。其核心目标是在确保数据安全的基础上,提高大数据资源和资产的可用性、易用性和可靠性,从而显著提升大数据资源和资产的价值7。数据治理是企业数字化转型的基础,对于推动企业有序开展数据治理工作,厘清企业转型升级的主要痛点和关键需求至关重要。数据治理还涉及到数据战略的制定,这是整个数据治理体系的首要任务。数据战略应由决策层制定,明确数据治理的方向,包括方针、政策等,以确保数据战略与业务战略的一致性,并在利益相关者之间达成共识。原创 2024-06-03 17:50:10 · 606 阅读 · 1 评论 -
大数据的数据采集
大数据采集是指从各种来源收集大量数据的过程,这些数据通常是结构化或非结构化的,并且可能来自不同的平台、设备或应用程序。大数据采集是大数据分析和处理的第一步,对于企业决策、市场分析、产品改进等方面具有重要意义。原创 2024-06-03 15:05:27 · 1787 阅读 · 1 评论 -
数据图同步软件ETL
ETL(Extract, Transform, Load)软件是专门用于数据集成和数据仓库过程中的工具。ETL过程涉及从多个数据源提取数据,对数据进行转换以满足业务需求,然后将数据加载到目标数据库或数据仓库中。原创 2024-06-01 18:55:09 · 857 阅读 · 0 评论 -
【flink】开启savepoint
这样就开启好了。原创 2023-08-05 10:15:04 · 1667 阅读 · 0 评论 -
【flink】使用flink-web-ui提交作业报错
换了地址以后提交作业成功了。OKOKOKOK,哈哈哈哈哈哈哈哈哈哈哈哈!看一下我的StateBackend 文件地址是哪里?查看这里:/job-manager/config。在弹框中是无法看到具体错误信息的。使用WebUI提交作业出现错误。上传的jar 包位置在哪里啊?在这个目录下面我没有办法创建。怎么还没有办法创建呢?原创 2023-08-04 18:13:32 · 4013 阅读 · 0 评论 -
【flink】Chunk splitting has encountered exception
【代码】【flink】Chunk splitting has encountered exception。原创 2023-08-07 16:38:23 · 2990 阅读 · 0 评论 -
【flink】Checkpoint expired before completing.
【代码】【flink】Checkpoint expired before completing.原创 2023-08-07 13:38:24 · 2713 阅读 · 0 评论 -
【flinkCDC】Cannot read the binlog filename and position via ‘SHOW MASTER STATUS‘
没有开启开启binlog。去查看服务是否开启binlog。原创 2023-08-10 15:21:57 · 2145 阅读 · 0 评论 -
linux下搭建hadoop环境步骤
1、下载hadoop包 wget http://apache.freelamp.com/hadoop/core/stable/hadoop-0.20.2.tar.gz2、 tar xvzf hadoop-0.20.2.tar.gz 3、安装JDK,从oracle网站上直接下载JDK,地址: http://www.oracle.com/technetwork/java/javase/downlo原创 2016-07-24 19:16:42 · 662 阅读 · 0 评论