解决方案(问题)
文章平均质量分 67
以实战为中心,主要介绍在软硬件安装、数据开发、数据治理过程中遇到的问题及企业级解决思路和方案。
王旭亮_
欢迎来到大数据技术人的浪漫圣地,不要让工作成为生活的全部,你也可以有诗和远方!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【神软大数据开发平台-接口数据同步】
本文介绍了数据抽取工具的四大核心功能:1)提供HTTP算子界面化配置,便捷实现接口数据抽取;2)支持输出多种类型数据源,满足多样化需求;3)内置时间参数功能,灵活实现增量/全量数据抽取;4)支持参数化配置,可并行执行多个接口任务。这些特性有效提升了数据抽取的效率和灵活性,为数据处理工作提供了便利的解决方案。原创 2025-07-03 11:39:43 · 358 阅读 · 0 评论 -
【Hudi-SQL DDL创建表语法】
•以SQL方式创建一个hudi表的外表,与spark-shell or deltastreamer方式创建的hudi外表相同。Hudi当前不支持使用char、varchar、tinyint、smallint类型,建议使用string或int类型。CREATE TABLE命令通过指定带有表属性的字段列表来创建Hudi Table。表2 CREATE TABLE Options描述。•创建非分区表-- 创建一个cow内部表。表1 CREATE TABLE参数描述。– 创建一个mor外部表。原创 2025-03-04 16:24:51 · 785 阅读 · 0 评论 -
【ClickHouse 特性及应用场景】
传统数据库在数据大小比较小,索引大小适合内存,数据缓存命中率足够高的情形下能正常提供服务。但残酷的是,这种理想情形最终会随着业务的增长走到尽头,查询会变得越来越慢。你可能通过增加更多的内存,订购更快的磁盘等等来解决问题(纵向扩展),但这只是拖延解决本质问题。如果你的需求是解决怎样快速查询出结果,那么ClickHouse也许可以解决你的问题。4.读取数据时,会从数据库中提取出大量的行,但只用到一小部分列。1.不支持真正的删除/更新支持 不支持事务(期待后续版本支持)7.对于简单查询,允许大约50毫秒的延迟。原创 2025-02-18 11:45:51 · 687 阅读 · 0 评论 -
【数据治理-设计数据标准】
针对这些重要的业务数据,建立让业务方、技术方、管理方都能认同的数据标准,统一业务数据的定义、结构、格式等方面,从而实现企业范围内的数据产生、使用、分析、共享的无障碍流通。指标就是用基于对业务进行分析的需求而制定的用某一个统一的标准去衡量业务状况的数值指示器,业务指标的数据变化情况会直接反映某一项业务的运营变化情况,指标用户(一般是管理者和业务分析者)会根据所反映出来的变化情况,及时的对现实业务做出调整。(1)根据定义数据标准的对象不同,数据标准可以分为面向业务数据的数据标准和面向分析数据的数据标准。原创 2024-09-29 10:55:20 · 747 阅读 · 0 评论 -
【数据治理-构建数据标准体系】
根据业务架构、数据架构的设计结果,对现有业务领域工作流程、信息化系统、数据现状进行综合调研和评估,确定数据标准的覆盖范围、必要性和紧迫程度。综合数据架构设计和既有系统已有的数据,根据业务数据标准模板的要求和指引,从业务、技术、管理三个视角明确业务对象的业务术语标准、属性标准和代码集标准。(1)数据标准的规划首先是在公司业务架构和数据架构的范围内,对公司业务和数据进行调研、分析和盘点,结合实际的数据标准需求,明确数据标准的范围,再根据实际情况的不同,逐步推进数据标准体系的各项工作。原创 2024-09-29 10:47:52 · 1817 阅读 · 0 评论 -
【浅谈国产化大数据软件及发展趋势】
当下的祖国各方面都在不断成长,有些领域在国际中也占据着重要地位,各个企业如今都在大力的支持国产化的软件,当然国产化的软件就像一个刚成长的孩子,需要给予鼓励和支持,而不是打压。如今企业中不乏有些个别声音在说,国产化软件和国外软件存在差距,这确实是存在的,我们也要正视差距,缩小差距,勇于赶超。通过实际应用不断优化软件功能,提高用户体验,增强软件的市场竞争力。(4)政策支持:随着国家对信息技术自主可控的重视,国产化软件得到了政策的大力支持,这为国产大数据软件的发展提供了良好的政策环境和发展机遇。原创 2024-09-10 11:04:21 · 1215 阅读 · 0 评论 -
【神软大数据治理平台-高级动态SQL(接口开发)】
神软大数据治理平台-高级动态SQL(接口开发)原创 2024-08-05 14:50:54 · 676 阅读 · 0 评论 -
【Kettle数据采集的优化】
Kettle数据采集优化原创 2024-07-26 10:23:25 · 1327 阅读 · 0 评论 -
【Kettle实现神通(数据库)MPP增量、全量数据ETL,同步任务Linux运行(通用)】
具体Kettle操作步骤不做过多介绍,主要技术方案说明,Kettle8.2版本放在底部链接提取,本次采用Kettle实现源端:神通数据通用库、目标端:神通MPP增量数据同步,并在服务器端运行Job。原创 2024-07-25 16:07:57 · 1103 阅读 · 0 评论 -
【互联网金融湖仓一体建设实践】
MC 数仓对外表的计算效率虽然低于内表,但是湖到仓的数据抽取只需要执行一次,后续仓内计算效率是Hive 的5倍以上,仓内建模加工效率也是Spark的2倍左右。认证信息、HDFS 读写服务,可以读取 HMS 的 Hive 表元数据,将。1) 用户的数据湖不能满足数仓的多租户、安全隔离、Serverless、2)创建OSS和VPC中的Hadoop实例的外部服务对象,将数据。将OSS目录数据识别为表的结构,MC可以读取DLF探查的OSS元。不冗余存储DLF或HMS的元数据,不冗余存储OSS或HDFS的数。原创 2024-07-11 10:42:34 · 933 阅读 · 0 评论 -
【ROMA核心特性数据、服务、消息、设备集成及统一运维】
FDI旨在解决多种数据源的快速灵活集成能力,您可以在任意时间、任意地点、任意系统之间实现实时数据订阅和定时增量数据迁移。(1)数据集成任务的生命周期管理(2)FDI支持修改数据集成任务的信息、查看数据集成任务的运行报告、查看数据集成任务的运行日志、查看数据集成任务状态,完成数据集成任务的生命周期管理功能。(1)灵活的数据读写支持 MySQL、文本文件、消息、API等多种数据的分片读取和写入。原创 2024-05-06 17:06:39 · 1638 阅读 · 0 评论 -
【ROMA解决方案和功能架构】
1、基于ROMA融合集成平台,实现企业应用、数据、API 、OT设备、云服务、合作伙伴应用之间的集成连接。2、ROMA主要包含四个组件:数据集成(Fast Data Integration,简称FDI)、服务集成(API Connect,简称APIC)、消息集成(Message Queue Service,简称MQS)、设备集成(LINK)。原创 2024-04-23 10:33:25 · 2864 阅读 · 1 评论 -
架构设计方法(4A架构)-技术架构
技术架构将实现从传统垂直、封闭式的IT架构转变为云化的开放架构,辅以运营、运维、安全三大支柱,打造云化的IT统一技术平台,以支撑数字化转型落地。原创 2024-03-04 12:44:58 · 2305 阅读 · 0 评论 -
架构设计方法(4A架构)-应用架构
1、应用服务应归集到不同的应用系统模块。应用系统模块基于业务对象进行识别,同时考虑团队因素,一般与服务全功能团队规模相匹配。2、应用服务是处理一个业务对象的业务活动的逻辑功能集合。应用服务的功能应独立且完整,应用服务应“可度量、可定价、有价值”。原创 2024-03-04 10:22:16 · 3879 阅读 · 0 评论 -
架构设计方法(4A架构)-信息架构
属性是用来描述所属业务对象的性质和特征。1、考虑技术约束和考量、应用要求、性能要求,支撑详细的数据需求和业务规则的实施,设计出的数据在IT系统中的具体存储结构。2、是面向计算机物理表示的具体实现模型,与具体的DBMS类型有关。原创 2024-03-01 13:50:29 · 2705 阅读 · 0 评论 -
架构设计方法(4A架构)-业务架构
依据企业架构标准组织The Open Group的定义,企业架构描述构成企业的要素和要素之间关系,以及用于管控架构设计和演进的原则和指引。1、价值流是一组端到端的活动集合,能够为外部客户或内部用户创造一个有价值的结果。2、有别于流程,主要描述企业为他的客户创造什么价值以及如何创造价值。1、业务能力定义是业务自身拥有或者从外部获取的特定能力,以实现某一特定目的和结果。2、业务能力的输出本质上是从不同维度对TOBE业务能力的构建设计,需要参考行业趋势和领先实践。原创 2024-02-28 10:18:16 · 14407 阅读 · 0 评论
分享