
大数据
NBI大数据可视化分析
这个作者很懒,什么都没留下…
展开
-
(4)SparkSQL中如何定义UDF和使用UDF
Spark SQL中用户自定义函数,用法和Spark SQL中的内置函数类似;是saprk SQL中内置函数无法满足要求,用户根据业务需求自定义的函数。原创 2022-09-26 10:21:54 · 793 阅读 · 0 评论 -
(2)sparkstreaming滚动窗口和滑动窗口演示
二、滑动窗口(Sliding Windows)与滚动窗口类似,滑动窗口的大小也是固定的。定义滑动窗口的参数有两个:除去窗口大小(window size)之外,还有一个滑动步长(window slide),代表窗口计算的频率。窗口之间没有重叠,也不会有间隔,是“首尾相接”的状态。.window(Seconds(10),Seconds(10)) 10秒的窗口大小和10秒的滑动大小,不存在重叠部分。.window(Seconds(10),Seconds(5)) 10秒的窗口大小和5秒的活动大小,存在重叠部分。原创 2022-09-05 15:13:28 · 1644 阅读 · 0 评论 -
(5)Flink CEP SQL四种匹配模式效果演示
从匹配成功的事件序列中最后一个对应于patternItem的事件开始进行下一次匹配。从匹配成功的事件序列中第一个对应于patternItem的事件开始进行下一次匹配。从匹配成功的事件序列中的最后一个事件的下一个事件开始进行下一次匹配。从匹配成功的事件序列中的第一个事件的下一个事件开始进行下一次匹配。原创 2022-08-24 15:33:20 · 753 阅读 · 0 评论 -
(4)Flink CEP SQL贪婪词量演示
(3)使用贪婪词量 {n,}(n或者更多行(n≥O))(2)使用贪婪词量 {n}(严格匹配n行)(1)使用贪婪词量 *(匹配0行或多行)贪婪词量 *(匹配0行或多行)原创 2022-08-19 18:46:01 · 557 阅读 · 0 评论 -
(3)Flink CEP SQL宽松近邻代码演示
需要借着贪婪词量来实现宽松近邻效果。(3)构造数据,定义事件组合。(2)定义一个消息对象。原创 2022-08-15 10:28:25 · 205 阅读 · 0 评论 -
(2)Flink CEP SQL严格近邻代码演示-风控系统构建利器
(2)Flink CEP SQL严格近邻代码演示-风控系统构建利器原创 2022-08-13 11:42:38 · 568 阅读 · 0 评论 -
(1)Flink CEP复杂事件处理引擎介绍
复杂事件处理(CEP)既是把不同的数据看做不同的事件,并且通过分析事件之间的关系建立起一套事件关系序列库。利用过滤,聚合,关联性,依赖,层次等技术,最终实现由简单关系产生高级事件关系。在Flink CEP中匹配模式分为严格近邻模式和宽松近邻模式。在可编程方面,Flink同时推出了Flink SQL CEP,开发者可以通过较为属性的SQL语法快速构建各类CEP事件组合应用。因此,在它们之间不能存在没有映射到A或B的行。Flink CEP能够利用的场景较多,在实际业务场景中也有了广泛的使用案例与经验积累。...原创 2022-08-12 10:38:16 · 814 阅读 · 0 评论 -
(8)FlinkSQL自定义UDF
Flink提供了自定义函数的基础能力,在需要满足特殊业务场景需求时,根据自身需要按需定制自己的UDF 下面将简单演示一个UDF的定义和UDF的使用过程:原创 2022-08-08 10:29:38 · 326 阅读 · 0 评论 -
(7)FlinkSQL将kafka数据写入到mysql方式二
代码】(7)FlinkSQL将kafka数据写入到mysql方式二。原创 2022-08-08 10:26:16 · 295 阅读 · 0 评论 -
(6)FlinkSQL将kafka数据写入到mysql方式一
这里不展开zookeeper、kafka安装配置。(1)首先需要启动zookeeper和kafka。(4)从kafka接入数据,并写入到mysql。(2)定义一个kafka生产者。(3)定义一个消息对象。原创 2022-08-08 10:23:56 · 1041 阅读 · 1 评论 -
(4)FlinkSQL将socket数据写入到mysql方式一
本章节主要演示从socket接收数据,通过滚动窗口每30秒运算一次窗口数据,然后将结果写入Mysql数据库。(3)从socket端接收数据,并设置30秒触发执行一次窗口运算。(5)效果演示,每30秒往数据库写一次数据。(2)编写socket代码,模拟数据发送。(4)定义一个写入到mysql的sink。(1)准备一个实体对象,消息对象。...原创 2022-08-08 10:13:32 · 576 阅读 · 0 评论 -
(3)FlinkSQL滑动窗口Demo演示
滑动窗口(Sliding Windows)与滚动窗口类似,滑动窗口的大小也是固定的。区别在于,窗口之间并不是首尾相接的,而是可以“错开”一定的位置。定义滑动窗口的参数有两个:除去窗口大小(window size)之外,还有一个滑动步长(window slide),代表窗口计算的频率。场景:接收通过socket发送过来的数据,定义一个1小时的时间窗口大小,每30秒滑动触发运算一次。(3)从socket端接收数据,并设置30秒触发执行一次窗口运算。滚动窗口和滑动窗口的区别在于一个没有重叠部分,一个有重叠部分。.原创 2022-08-06 19:18:58 · 907 阅读 · 0 评论 -
(2)FlinkSQL滚动窗口Demo演示
滚动窗口(Tumbling Windows) 滚动窗口有固定的大小,是一种对数据进行均匀切片的划分方式。窗口之间没有重叠,也不会有间隔,是“首尾相接”的状态。滚动窗口可以基于时间定义,也可以基于数据个数定义;需要的参数只有一个,就是窗口的大小(window size)。场景:接收通过socket发送过来的数据,每30秒触发一次窗口计算逻辑。(3)从socket端接收数据,并设置30秒触发执行一次窗口运算。(2)编写socket代码,模拟数据发送。(1)准备一个实体对象,消息对象。...原创 2022-08-06 19:14:32 · 423 阅读 · 0 评论 -
(1)通过FlinkSQL将数据写入mysql demo
FlinkSQL的出现,极大程度上降低了Flink的编程门槛,更加容易理解和掌握使用。今天将自己的笔记分享出来,希望能帮助在这方面有需要的朋友。(1)首先引入POM依赖: (2)编写代码(3)执行结果:...原创 2022-08-06 19:10:41 · 830 阅读 · 0 评论 -
利用NBI大数据可视化工具做RFM模型分析,洞察数据价值,驱动业务增长
我们先来了解一下什么是RFM模型:RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理的分析模式中,RFM模型是被广泛提到的。该数据模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。最近一次消费频率(Recency)消费频率(Frequency)消费金额(Monetary)接下来根据上面三项指标做会员分类:我们把这3个指标按价值从低到高排序,并把这3个指标作为XYZ坐标轴,就可以把空间分为8部分,这样就可以把用户分为8类:到原创 2021-04-24 14:15:03 · 470 阅读 · 0 评论 -
对数据可视化工具应当具备的核心能力和价值的几点思考
可能大家都听说过这样一句话"字不如表、表不如图",其实背后所表达出来的意思是对于复杂难懂且体量庞大的数据而言,图表的信息量要大得多,这也是数据可视化的核心价值所在。数据可视化价值准确高效直观的传递传递数据中的规律和信息; 实时监控系统各项数据指标,实现数据的自解释; 基于可视化洞察数据规律,指定精准的运营策略;基础构建原则简单的步骤如下:基于业务需求,完成可视化数据处理(收集,规则,定时任务等)。借助常用的图表进行组合展示,但是也有一些注意事项如下:可视化的数据要关联核心的有业务价值的原创 2020-12-21 15:28:47 · 505 阅读 · 0 评论 -
国内首款基于.NET Core平台的大数据可视化分析工具平台
国内首款基于.NET Core平台的大数据可视化分析工具平台NBI一站式自服务大数据可视化分析平台是一款基于.NET Core开发的自助式可视化分析大屏展示平台,可以通过平台零代码或低代码方式构建各类数据展示分析;NBI一站式自服务大数据可视化分析平台提供了多种灵活的部署方式,支持安装包模式安装、手动安装、docker镜像安装NBI一站式自服务大数据可视化分析平台跨平台性:支持部署在Windows、Linux、MacOS等操作系统上运行NBI一站式自服务大数据可视化分析平台V4.6.5主要更新内原创 2020-08-06 12:48:58 · 1487 阅读 · 0 评论 -
数据治理中的数据血缘关系是什么?用来解决什么问题
前言:数据血缘属于数据治理中的一个概念,是在数据溯源的过程中找到相关数据之间的联系,它是一个逻辑概念。数据治理里经常提到的一个词就是血缘分析,血缘分析是保证数据融合的一个手段,通过血缘分析实现数据融合处理的可追溯。大数据数据血缘是指数据产生的链路,直白点说,就是我们这个数据是怎么来的,经过了哪些过程和阶段。数据血缘关系的应用场景是什么:在数据的处理过程中,从数据源头到最终的数据生成...原创 2020-04-21 11:10:05 · 7357 阅读 · 0 评论 -
数据中台是什么,它能解决什么问题
前言:近几年来数据中台概念大火,市面上掀起了一波建业务中台、数据中台热潮,那么数据中台到底是什么?它的出现能解决什么问题呢?首先数据中台的概念最早由阿里提出,自从阿里提出了“大中台,小前台”概念之后,数据中台这个概念火了起来,不少企业,无论是互联网企业还是传统企业纷纷搭建起了自家的数据中台,究竟数据中台有什么魅力,能让企业如此重视?本文主要从数据中台是什么、怎么做数据中台和为什么要做数据中台三...原创 2020-04-12 14:15:29 · 826 阅读 · 0 评论 -
企业有了ERP为什么还需要大数据分析,它能为企业解决什么问题?
如果一个企业不做数据分析,那将意味着什么?用户在哪?我怎样才能和他们互动?我不知道我的营销活动到底效果如何?用户对我品牌的忠诚度在减弱?我的销售怎么样?我的生产研发怎么样?我在浪费广告预算?大数据分析能为企业解决什么问题?(1)信息孤独:如今的企业采用OA、ERP、CRM、HR等信息化手段后,“信息孤岛”效应也随之产生,各个系统之间互相封闭,无法全面、及时...原创 2019-07-23 11:57:09 · 997 阅读 · 2 评论 -
基于SpringBoot实现KafKa的生产者和消费者示例
1.配置pom包<dependency> <groupId>org.springframework.kafka</groupId> <artifactId>spring-kafka</artifactId></dependency>2.配置application.yml kafka部分:kafka:...原创 2019-07-12 12:01:59 · 1286 阅读 · 0 评论 -
要使数据分析真正有价值和有洞察力,就需要高质量的可视化工具
要使数据分析真正有价值和有洞察力,就需要高质量的可视化工具。市场上有很多产品,特点和价格各不相同,本文列出了一些广泛认可的工具。其实企业如何选择一个合适的可视化工具,并不是一件容易的事情,需要仔细的考虑。Salesforce公司的一项调查显示:53%的员工要经常查看分析数据,却只是依靠手工操作。在大量的电子表格、图表和数据中滚动鼠标,就好比是大海捞针。数据可视化工具面向用户直观显示结果,帮助用...原创 2019-09-25 15:24:39 · 344 阅读 · 0 评论 -
基于echarts组件制作数据可视化大屏
什么是数据可视化:数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。在实际工作中,数据分析能够帮助管理者进行判断和决策,以便采取适当策略与行动。数据可视化分析有什么作用:1.现状分析告诉你过去发生了什么,告诉你企业现阶段的整体运营情况,通过各个经营指标的完成情况来衡量企业的运营状态,以说明企业整体运营是更好了还是坏了,好的程度是如何,坏的程度又到哪里。2.原因分析...原创 2019-09-05 14:35:55 · 2192 阅读 · 1 评论 -
教您通过NBI大数据可视化工具零编码轻松实现桑基图的制作
人人都是数据分析师的时代,我们如何才能真正让普通用户拥有数据分析的能力,我们都知道要想掌握大数据分析,首先在技术层面就得有一定的技术深度和广度,数据分析大致分为数据采集,数据存储,数据建模计算,数据可视化分析四个阶段,要想掌握这些能力,那大家可能想到的是需要一个有实力的团队才能做到吧,那今天就给大家介绍一款大数据可视化分析工具(更多资料了解:http://nbi.easydatavis.com:8...原创 2019-07-15 15:48:37 · 313 阅读 · 0 评论 -
SpringBoot+SparkSQL操作JSON字符串
在SpringBoot中通过maven来做包管理构建,有几个地方需要注意一下的,需要解决包之间的冲突,否则运行时会报错:(1)sparkSQL中需要先排除两个包: <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-sql_2.11</ar...原创 2019-07-18 14:36:38 · 1733 阅读 · 0 评论 -
用它来做数据可视化分析,真的很简单,老板夸我效率高
数据可视化都有一个共同的目的,那就是准确而高效、精简而全面地传递信息和知识。可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。并且利用合适的图表直截了当且清晰而直观地表达出来,实现数据自我解释、让数据说话的目的。而人类右脑记忆图像的速度比左脑记忆抽象的文字快100万倍。因此,数据可视化能够加深和...原创 2019-07-16 13:41:42 · 298 阅读 · 0 评论 -
数据中台战略对企业的意义
数据中台战略对企业的意义一、为什么要建设数据中台因为在当今互联网时代,用户才是商业战场的中心,为了快速响应用户的需求,借助平台化的力量可以事半功倍。不断快速响应、探索、挖掘、引领用户的需求,才是企业得以生存和持续发展的关键因素。目前,数据体量、产业规模以及云计算高速发展所推动的基础设施成本都已不再是问题,大数据能否创造真实的商业价值和回报是大数据企业真正关心的核心问题。过去,所有大数据企...原创 2019-07-12 10:11:46 · 806 阅读 · 0 评论 -
数据时代不具备数据可视化分析能力,你怎么在工作中脱颖而出?
数据可视化和信息可视化都是可视化的一种方式,数据可视化将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。信息可视化,旨在把数据资料以视觉化的方式表现出。信息可视化是一种将数据与设计结合起来的图片,有利于个人或组织简短有效地向受众传播信息的数据表现形式。我们常常迷失在数据中...原创 2019-07-19 16:54:10 · 231 阅读 · 0 评论 -
企业在数字化转型,数据化运营上遇到了哪些困境,如何解决?
公司决策者意识到成功的数字体验越来越重要。调查受访者表示,这种成功的衡量标准是,用户体验和满意度提高(53%),市场敏捷性提高(49%),收入和盈利能力增加(49%),员工生产力提高(49%),以及更快的上市时间(48%)。然而,数字战略的失败原因是由于系统各种不足造成的。根据调查显示,在努力实现更好的数字战略时,有五个最重要的障碍:(1)预算约束(51%)(2)过于复杂或僵化的传统...原创 2019-07-24 13:50:55 · 1163 阅读 · 0 评论 -
用了它,你不再羡慕别人家的数据可视化效果多好看
数据可视化是数据领域一个重要的分支,目的是“让数据说话”,展现数据之美。好的图表会说话,好的图表可以抓住用户的心。研究发现:人脑处理图片信息是同步进行的,而处理文字信息则是一步一步循序渐进的,而且一篇文字下来,大部分人只记住了其中的20%;人在看报纸时,99%的文字信息会自动被过滤掉,脑子里只残留了可怜的1%;人脑处理图片的速度是处理文字的6000倍。也就是说,一篇6000字的文章需要10...原创 2019-07-17 15:40:05 · 158 阅读 · 0 评论 -
大数据可视化分析,我们通常是怎么快速实现它的
大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。高质量的可视化工具对于数据分析至关重要。数据可视化工具是一种应用软件,帮助用户以可视化、图形化的格式显示数据,呈现数据的完整轮廓。像饼状图、曲线图、热图、直方图、雷达/蜘蛛图只是可视化中的一...原创 2019-07-29 16:03:59 · 265 阅读 · 0 评论 -
做数据可视化,为什么我们不再直接使用D3.js、Echarts
D3是什么全称是(Data-Driven Documents),一个被数据驱动的文档简单点,是一个JavaScript函数库,使用它主要用来做数据可视化。D3 是一个开源项目,作者是纽约时报的工程师。学习 D3 需要什么预备知识HTML:超文本标记语言,用于设定网页的内容CSS:层叠样式表,用于设定网页的样式JavaScript:一种直译式脚本语言,用于设定网页的...原创 2019-07-25 14:59:35 · 695 阅读 · 0 评论 -
用数据可视化的方式做汇报,更容易显现成绩、升职加薪更近一步
在日常工作中,老板总是会时不时的让我们做工作汇报,而这也是我们能够在老板面前展示自己的机会。但是,如果你拿给老板的是这样一张数据密密麻麻的表格,你觉得老板能够在短时间内看懂你的数据吗?想要让老板在短时间内看懂我们想要表达的内容,就需要对表格数据进行可视化操作。俗话说:字不如表,表不如图。一图胜千言,通过数据可视化可以直观的表明我们的态度,也能在老板面前更好的展示自己。如果将上...原创 2019-07-30 17:29:52 · 338 阅读 · 0 评论 -
数据可视化分析除了需要编码的Python,还有更简单的方式吗?
大数据、数据分析的兴起和火爆,也带动了数据可视化的广泛应用。说起数据分析和可视化的关系,就好比你为一堆散乱的拼图写了一份说明,告诉他这个数据是什么样子,代表什么。可以说,数据可视化虽然不是必不可少的,但却是可以加快效率,为报告锦上添花的。今天,说起数据可视化,我们就不得不谈一下数据可视化工具了。主要说到的这个工具也是最近在数据分析圈比较受追捧的一个软件——Python。Pytho...原创 2019-07-22 13:41:20 · 138 阅读 · 0 评论 -
基于Python的数据可视化库pyecharts介绍
什么是pyecharts? pyecharts 是一个用于生成 Echarts 图表的类库。 echarts是百度开源的一个数据可视化 JS 库,主要用于数据可视化。pyecharts 是一个用于生成 Echarts 图表的类库。实际上就是 Echarts 与 Python 的对接。 使用 pyecharts可以生成独立的网页,也可以在 flask , Django...原创 2019-07-26 11:45:20 · 509 阅读 · 0 评论 -
能将可视化做到简单、易懂、高效、兼具美感就是好的数据可视化
数据可视化都有一个共同的目的,那就是准确而高效、精简而全面地传递信息和知识。可视化能将不可见的数据现象转化为可见的图形符号,能将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。并且利用合适的图表直截了当且清晰而直观地表达出来,实现数据自我解释、让数据说话的目的。而人类右脑记忆图像的速度比左脑记忆抽象的文字快100万倍。因此,数据可视化能够加...原创 2019-08-05 18:03:09 · 462 阅读 · 0 评论 -
ElasticSearch群集搭建介绍,实现高可用
ElasticSearch简介:ElasticSearch 是一个分布式、高扩展、高实时的搜索与数据分析引擎。它能很方便的使大量数据具有搜索、分析和探索的能力。充分利用ElasticSearch的水平伸缩性,能使数据在生产环境变得更有价值。ElasticSearch 的实现原理主要分为以下几个步骤,首先用户将数据提交到Elastic Search 数据库中,再通过分词控制器去将对应的语句分词,...原创 2019-08-02 14:49:08 · 319 阅读 · 0 评论 -
几分钟即可实现数据可视化,是怎么做到的?
随着企业数据的日久累计,企业生产的数据无论从数量空间还是从维度层次上都日益繁杂。面对大量数据,管理层常常望洋兴叹:要么企业自产的大量数据不能有效利用,无法提供决策依据;要么数据展示模式繁杂晦涩,无法快速甄别有效信息。如何将海量数据经过抽取、加工、提炼,通过可视化方式展示出来,改变传统的文字描述识别模式,让决策者更高效的掌握重要信息和了解重要细节,这关系到企业重大决策的制定和发展方...原创 2019-08-22 22:10:08 · 229 阅读 · 0 评论 -
基于分布式关系型数据库,实现轻松应对百亿级数据分析场景解决方案
MyCat是什么?从定义和分类来看,它是一个开源的分布式数据库系统,是一个实现了MySQL协议的服务器,前端用户可以把它看作是一个数据库代理,用MySQL客户端工具和命令行访问,而其后端可以用MySQL原生协议与多个MySQL服务器通信,也可以用JDBC协议与大多数主流数据库服务器通信,其核心功能是分表分库读写分离,即将一个大表水平分割为N个小表,存储在后端MySQL服务器里或者其他数据库里。...原创 2019-08-16 12:26:38 · 235 阅读 · 0 评论 -
数据分析选它就对了,只需三步轻松搞定数据可视化分析
随时时代的不断发展,云计算,大数据,人工智能,物联网,5G这些新兴行业不断演进,快速的决策与行动能力已经成为每一家企业的必备能力,但是往往数据分析相关的采购成本高,链条长,技术复杂度高,让企业遥不可及,针对这些问题,今天就给大家分享一款简单易用的大数据可视化分析工具,让每家企业都能拥有数据洞察能力。NBI一站式数据可视化分析平台NBI一站式大数据分析平台作为新一代自助式、探索式分析工具,在...原创 2019-07-12 17:26:28 · 293 阅读 · 0 评论