大数据学习总结(1)任务描述

本文探讨了大数据平台面临的问题及解决方案,提出了结合数据集成与分析展现的发展方向。通过开发建模工具对接ElasticSearch,支持高效业务建模与运行。针对海量数据实时查询难题,采用全文检索方案实现毫秒级响应。

 

 

1、问题描述

单纯的大数据平台无法满足行业用户需要,无法在同类产品中凸显竞争力。

需要抽取业务共性,帮助用户构建满足需要的业务。

发展方向:数据集成+分析展现

 

2、业务痛点 

痛点:对所有文本皆有实时查询需求
难点:传统SQL使用WHERE子句匹配LIKE关键词,在庞大的数据字段中搜索某些想要的字,需遍历所有数据页或者索引页,查询效率底,

         当出现千万级以上数据时,耗时较高,无法满足实时要求
方案:使用全文检索方案,分布式架构,即使PB级量级也可做到毫秒级查询

 

 

3、任务目标:

开发一个建模工具+框架,和 Elastic Search的数据模型对接,

抽取业务语义模型,支持用户基于业务语义模型进行业务建模和运行业务。

 

4、验证场景:

a、客户画像

b、关系查询

c、搜索任务

 

5、参考资料:

阿里云的客户画像:

https://help.aliyun.com/document_detail/47990.html?spm=5176.doc47988.6.542.ksYfBu 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值