自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(342)
  • 资源 (18)
  • 收藏
  • 关注

原创 一文讲透数据价值管理

小的时候父母、老师就总教育我们:做人有做有价值的人,做事要做有意义的事。但是,什么才算是有价值和意义的呢?就如现在我写文章,写文章是有价值的吗?如果文章没有干货,对自己没有提升,对读者没有启发,那就没有任何意义。于是,我给“谈数据”定位,我的每一篇文章不追求多高的阅读量,只希望能够对读者或多或少有所收获。也许哗众取宠、吸人眼球的文章更受大众欢迎,但是我更看重文章本身对于读者的价值。对于从事数据工作的人员来讲,也会经常遇到的这样困惑:我们整天取数、治数、出报表,这些工作到底有什么价值?如果数据

2021-02-02 15:20:24 1203

转载 52 条 SQL 语句性能优化策略,建议收藏

本文会提到52条SQL语句性能优化策略。1、对查询进行优化,应尽量避免全表扫描,首先应考虑在where及order by涉及的列上建立索引。2、应尽量避免在where子句中对字段进行null值判断,创建表时NULL是默认值,但大多数时候应该使用NOT NULL,或者使用一个特殊的值,如0,-1作为默认值。3、应尽量避免在where子句中使用!=或<>操作符,MySQL只有对以下操作符才使用索引:<,<=,=,>,>=,BETWEEN,IN,以及某些时候的LIK

2021-02-02 15:17:45 802

原创 清醒认识数据第一步,把关数据质量

做过数据产品的人都会知道,质量高的数据对于产品的意义。笔者在之前曾经历过数据质量管理的具体功能设计,算是较为完整地感受过数据质量管理过程。所以在此简单复盘下经验,借此抛砖引玉。战战兢兢地写下标题,得意下“清醒”这个词用得真是独树一帜,跟外面那些妖艳贱货好不一样。我们常常说人要时刻保持清醒,这样才能不被假象所蒙蔽。那数据其实更需要这点,我们需要透过数据挖掘本质,如果数据是不具备完整人格的,缺失完整性、规范性、一致性等维度,那么我们看到的本质也是偏差的。开篇先鬼扯一下,详情请往下滑~基本概念.

2021-02-02 15:16:43 1050

原创 数字化的YES or NO?银行业的数字化转型怎么做?

数字化主要包含大数据、云计算、人工智能以及区块链技术。通常称为ABCD:A——人工智能(Artificial Intelligence),B——区块链(Block Chain),C——云计算(Cloud),D——大数据(Big Data)。这几者之间的关系,普遍的观点是“融合发展”,分不清孰重孰轻,孰先孰后,而是你中有我、我中有你。比如,基于区块链技术的工业互联网,其中既有区块链技术,也有大数据技术,还有云计算技术,三者合成一体,又衍生出了人工智能和物联网的概念。“建设现代化经济体系”是党的十.

2021-02-02 15:15:00 567

转载 安利3个Python数据分析EDA神器

来源:Python数据科学作者:东哥起飞EDA是数据分析必须的过程,用来查看变量统计特征,可以此为基础尝试做特征工程。东哥这次分享3个EDA神器,其实之前每一个都分享过,这次把这三个工具包汇总到一起来介绍。1. Pandas_Profiling这个属于三个中最轻便、简单的了。它可以快速生成报告,一览变量概况。首先,我们需要安装该软件包。#安装Jupyter扩展widgetjupyternbextensionenable--pywidgetsnbextension#或者...

2021-02-02 15:12:20 351

原创 中小企业如何进行高效数据管理?

从大环境来看,大多数政府和企业已经完成了业务和管理各项工作的线上化,这个时候我们已经通过这些年的信息化、电子化,积累了大量的数据。对数据进行高效管理的基础就是这些已经存在的数据,对于中小企业来说就是要基于这些数据的深入挖掘分析,用数据来说话,用数据来支撑决策、用数据来推动业务和商业模式创新、推动业务流程优化,进而实现降本增效。说的更具体一点,就是通过收集企业日常运营的数据、客户使用产品服务的数据,以及市场和行业趋势等数据,形成企业日常运营的全景图,从中发现企业的问题,发现业务创新点,从而实现产品创

2021-02-02 14:57:34 683

转载 超全汇总!机器学习常用术语词汇表

AA/B 测试 (A/B testing)一种统计方法,用于将两种或多种技术进行比较,通常是将当前采用的技术与新技术进行比较。A/B 测试不仅旨在确定哪种技术的效果更好,而且还有助于了解相应差异是否具有显著的统计意义。A/B 测试通常是采用一种衡量方式对两种技术进行比较,但也适用于任意有限数量的技术和衡量方式。准确率 (accuracy)分类模型的正确预测所占的比例。在多类别分类中,准确率的定义如下:在二元分类中,准确率的定义如下:请参阅正例和负例。激活函数 (a..

2021-01-28 15:13:33 1612

转载 Python吊打Excel?7年Excel的数据分析师不服

有人说Python吊打Excel,作为一个有着7年Excel的数据分析师,我表示不服。看完我这个回答我相信你不用再看别人的回答了!昨天猫双11成交额破3723亿、京东破2000亿…你贡献多少?一个数据分析师能从这些数据中分析出来什么问题?不要告诉我消费能力是女人,小孩,老人,狗和男人。这个大家都知道啊。干货预警!Excel用的好,下班会很早,高效的选出双11最优惠的产品,利益最大化,作为一个Excel的深度使用者,Excel的功能实在是太多了,函数都有471个,彻底精通Exc.

2021-01-28 15:09:41 1093

转载 Python对比SQL的5大数据清洗场景和方法

在日常工作中,我们数据分析师会接到一些专项分析的需求,首先会搜索脑中的分析体悉,根据业务需求构建相应的分析模型(不只是机器学习模型),根据模型填充相应维度表,这些维度特征表能够被使用的前提是假设已经清洗干净了。但真正的原始表是混乱且包含了很多无用的冗余特征,所以能够根据原始数据清洗出相对干净的特征表就很重要。以下,我们分五个场景为大家讲解一下Python与SQL对比之后的数据清洗的场景和方法。前两天在Towards Data Science上看到一篇文章,讲的是用Pandas做数据清洗,作者将常用的

2021-01-28 15:08:02 938 1

原创 收藏收藏!数据分析必会的六大实用模型

对于刚刚接触数据分析的人来说,经常会有这样的困惑和疑问:数据分析究竟难不难?难的话难在哪?为什么有时候作分析不知道从何下手,只能眉毛胡子一把抓?其实就连一些已经在数据分析行业浸淫十几年的老油条,有时候做起分析来也会手忙脚乱,根本原因就在于没有抓住数据分析的本质,我们是为了用大量数据去分析、解释和预测基于数据的事实,你首先要明白自己做数据分析的目的是什么,是为了描述事件分析?还是为了预测?又或者是做规范性分析?掌握数据分析方法有一条好的捷径——套用分析模型,对新手来说几乎是百试百灵,只要掌握了下面几个

2021-01-28 15:04:19 592 2

转载 分享!几招收集信息和数据的方法,阿里,瑞幸资料通通都有

对于互联网人来说,信息收集是基本功,是很关键但又经常被忽略的能力。特别是对于产品经理而言,启动新项目、接触一个新的领域时,都需要先去了解这个行业、了解业务背景,观察行业的趋势以便做出正确的选择。例如前段时间,5G的概念炒得很火。有一天,领导想让你去分析分析现在5G行业的趋势以及应用场景,看看能跟自己家的产品怎么结合,该怎么做呢?很多同学从业多年还是习惯性先打开百度,再聪明一点的同学会到易观智库、199IT、友盟以及TrustData等资讯平台搜索相关的报告。这些渠道找到资料实在是很有限,同时也很难获

2021-01-28 15:02:42 1997

原创 讲解几个数据分析的常用指标

评价指标是评判数据表现的衡量标准,它是数据分析中非常重要的部分,也是产品经理必须掌握的重点内容。不同的数分任务采用不同的评价指标,对于同一种任务在不同场景下也会采用不同的评价指标。例如在检测垃圾邮件这个场景中,这是一个典型的二分类问题,所以可以用精确率和AUC曲线这两个指标判断模型的效果;在人脸识别场景中,使用误识率、拒识率和ROC曲线这三个指标评判模型的效果。不同指标的着重点不一样,一个指标在不同场景下适用性可能不一样,产品经理需要学习不同指标的特性,在项目中根据实际需要选择不同的评价指标。下文中

2021-01-28 15:01:13 3094

转载 万字长文告诉你喜茶为什么能成功

最近这段时间,我是越来越多看到数字化转型这个词。自从十九大报告首次出现了数字经济这一概念以后,网上出现了很多讲产业互联网,讲供给侧改革,讲数字化转型的文章。而这些文章表达的核心观点基本上都是,我们生活在一个数据驱动发展的时代,不能顺应时代发展进步的企业就会落后和淘汰。因为当前中国国内的数字经济总量非常高,对GDP的发展非常重要,所以数字化是大势所趋,所以企业必须进行数字化转型。看到这里我是万脸懵逼的。数字化的概念虽然使用的越来越多,但是到目前为止,并没有一个非常好的界定,也很少有人讲清楚数字

2021-01-28 15:00:04 2812

原创 打开智慧物流的钥匙就加快数字化转型吧

为什么要做智慧物流?物流业是我国国民经济的重要组成部分,2019年我国社会物流总额达到298.0万亿元,同比增长5.9%。在“工业4.0”、“互联网+”发展的大背景下,我国物流业也迎来了智能化升级改造,近年来,国家层面发布了多项政策以促进“智慧物流”的快速发展。提高物流效率,降低物流成本成为政府、物流企业与其客户力争实现的目标,而物流智能化、数字化是其根本途径。我国智慧物流发展阶段智慧物流的春天已经到来当下,智慧物流正在成为物流业转型升级的重要源泉,重塑着物流市场主体。通过整合社会.

2021-01-15 13:43:40 330

原创 打工人!政务、人力、制造业等行业超实用的40套报表模板来啦

在技术飞速发展的过程中,人们越来越怀疑传统的数据分析方法。可以通过对商业智能的各种误解来解释这一点,如今,这种误解正在作为有效的真理传播。例如,数据仓库已达到其目标。而数据质量似乎也正在失去其相关性,这是由于有意放弃数据建模和一个事实点。但是,对项目日常生活的特定看法揭示了不同的形象。人工智能(AI)、机器学习、实时、自助服务——这些只是目前数据分析中讨论的一些术语。对新技术和新流程的大肆宣传常常给人留下这样的印象:“过时的”现在是多余的。因此,商业智能在很大程度上已经从关于趋势和重要话题的讨论中消失了。当

2021-01-15 13:42:57 201

原创 Excel如何做甘特图,保姆级教程来了,海量模板任你挑选

1.为什么要用甘特图?复杂问题需要很多道工序,涉及到与多个人进行沟通,人的注意力没法持续关注,导致很容易忘掉很多重要步骤。像这种问题就要用到项目管理工具,在重要的节点上,来检查自己是否遗漏了重要的环节。比如手里总有十好几个工作任务同时在跑,手忙脚乱应付不了总是在怀疑人生;除了要完成领导布置的工作任务外,还要和其他部门各种沟通对接,微信群里时不时传来不断变化的需求……每天恨不得25小时都在工作,可工作进度还是难以把控,经常延误,到底怎么办呢?有人会说用专门的项目管理软件来管理多个工作任务就好了,但

2021-01-15 13:37:14 1675

转载 全网最祥,万字长文全面剖析ZooKeeper

一. ZooKeeper是什么ZooKeeper由雅虎研究院开发,是Google Chubby的开源实现,后来托管到Apache,于2010年11月正式成为Apache的顶级项目。ZooKeeper是一个经典的分布式数据一致性解决方案,致力于为分布式应用提供一个高性能、高可用,且具有严格顺序访问控制能力的分布式协调服务。分布式应用程序可以基于ZooKeeper实现数据发布与订阅、负载均衡、命名服务、分布式协调与通知、集群管理、Leader选举、分布式锁、分布式队列等功能。二. ZooKeep..

2021-01-15 10:56:55 205

原创 ETL还是ELT?这个工具玩转数据清洗实现高效率

除了大数据我们听到得多,还有就是ETL,ETL,ETL,那么,什么是ETL到底是什么呢?什么是ETL,以及ETL背景随着企业的发展,各业务线、产品线、部门都会承建各种信息化系统方便开展自己的业务。随着信息化建设的不断深入,由于业务系统之间各自为政、相互独立造成的数据孤岛”现象尤为普遍,业务不集成、流程不互通、数据不共享。这给企业进行数据的分析利用、报表开发、分析挖掘等带来了巨大困难。在此情况下,为了实现企业全局数据的系统化运作管理(信息孤岛、数据统计、数据分析、数据挖掘) ,为DSS(.

2021-01-15 10:32:05 388

原创 学会七大悖论,不管财税还是各大行业让你的数据分析不踩坑

统计学界,我总结了七个悖论数理统计学是数据分析的基础理论,我们之前所有为数据分析所做的工作,比如梳理指标、筛选数据、可视化等等,都是为了我们能够更好地找到数据之间的关系,利用统计学原理对这些关系进行界定和联系。但是在实际分析中,我们很可能会因为没有避开数理统计中常见的“坑”,造成我们最终分析结果与实际偏差很大,这是为什么呢?接下来,我们为大家介绍7个悖论,来看看数据之美。1、彩票悖论首先根据假设检验,如果原假设概率非常小,就可以拒绝原假设。假设0.0001就是一个非常小的概率,组织.

2020-11-20 14:11:25 435

原创 ETL还是ELT?这个工具玩转数据清洗实现高效率

除了大数据我们听到得多,还有就是ETL,ETL,ETL,那么,什么是ETL到底是什么呢?什么是ETL,以及ETL背景随着企业的发展,各业务线、产品线、部门都会承建各种信息化系统方便开展自己的业务。随着信息化建设的不断深入,由于业务系统之间各自为政、相互独立造成的数据孤岛”现象尤为普遍,业务不集成、流程不互通、数据不共享。这给企业进行数据的分析利用、报表开发、分析挖掘等带来了巨大困难。在此情况下,为了实现企业全局数据的系统化运作管理(信息孤岛、数据统计、数据分析、数据挖掘) ,为DSS(.

2020-11-20 13:58:08 524

原创 打工人!政务、人力、制造业等行业超实用的40套报表模板来啦

在技术飞速发展的过程中,人们越来越怀疑传统的数据分析方法。可以通过对商业智能的各种误解来解释这一点,如今,这种误解正在作为有效的真理传播。例如,数据仓库已达到其目标。而数据质量似乎也正在失去其相关性,这是由于有意放弃数据建模和一个事实点。但是,对项目日常生活的特定看法揭示了不同的形象。人工智能(AI)、机器学习、实时、自助服务——这些只是目前数据分析中讨论的一些术语。对新技术和新流程的大肆宣传常常给人留下这样的印象:“过时的”现在是多余的。因此,商业智能在很大程度上已经从关于趋势和重要话题的讨论中消失了。当

2020-11-20 11:32:40 187

原创 服务于民,智慧政务应该怎么做?数据治理和分析样样都行

从全球范围看,政务数据与社会数据融合利用最早起源于美国,20世纪70年代,美国联邦政府便开始搜集政府部门业务数据、公民民意数据及自然环境数据,通过处理分析,为应对科技问题及挑战提供数据参考。此后,美日韩等国家逐步认识到政务数据与社会数据融合利用的重要性,纷纷开展相关研究及实践探索。近年来,政务数据及社会数据的巨大价值得到政产学研各界广泛认同,数字政府打造、智慧社会建设、数字经济发展、企业数字化转型,都离不开两类数据的开发利用及价值激活。随着大数据战略的加快推进,大数据产业蓬勃发展,融合应用不断深化,我国大数

2020-11-20 11:00:49 349

原创 可视化越做越丑?这个办法大咖一说你就懂

作为一名快(ku)乐(bi)的可视化人,在公司里不仅要承担业务需求分析的工作,取数机的日常,就是经常熬夜加班做可视化,赶上领导指示甚至要忙大屏项目,最后却常常被领导臭骂,大家应该都听过领导这几句吐槽:“一张可视化大屏嘛?有什么难的?”“我去啊!这是啥啊,这是可视化?能不能让这个图表既大点、又小点?”“你做的这个可视化有什么用?”而像我这种摸爬滚打非“小白”,有时候辛苦熬夜做出可视化,自己已经满意的不行了,但是领导还是“NO!”打回,无限循环:为什么领导不喜欢我做的可视化?今晚!炫技开始!3D可视化

2020-11-18 16:06:37 106

原创 可视化越做越丑?这个办法大咖一说你就懂

作为一名快(ku)乐(bi)的可视化人,在公司里不仅要承担业务需求分析的工作,取数机的日常,就是经常熬夜加班做可视化,赶上领导指示甚至要忙大屏项目,最后却常常被领导臭骂,大家应该都听过领导这几句吐槽:“一张可视化大屏嘛?有什么难的?”“我去啊!这是啥啊,这是可视化?能不能让这个图表既大点、又小点?”“你做的这个可视化有什么用?”而像我这种摸爬滚打非“小白”,有时候辛苦熬夜做出可视化,自己已经满意的不行了,但是领导还是“NO!”打回,无限循环:为什么领导不喜欢我做的可视化?今晚!炫技开始!

2020-10-28 17:11:01 186

原创 大屏幕实时数据可视化解决方案?

近几年来随着智慧园区、智慧城市的兴起,大屏数据可视化也有了越来越多的可落地的应用场景。对于管理层和决策层来说大屏的展示让数据更加的直观漂亮,让问题暴露的更加显而易见。其实,数据可视化大屏是一个很重要的“面子”,它一方面能够通过酷炫的效果让人眼前一亮,同时也能借助精心的排布及策划把业务和数据的“里子”有效的传达出来。表里如一,才是好的大屏该有的标准。题主在上面所说的实时刷新的问题,其实现在很多产品都已经能够满足要求了,“酷屏”当然也是其中之一,不光能够实时刷新数据还可自行定义刷新间隔时间等。作为亿信华

2020-09-30 15:18:54 5459

原创 数据分析师如何搭建数据运营指标体系?

指标体系的设计是一个业务数据化的过程。好的指标设计能够抽象目标具体化,具有直接实践意义。1)什么是指标通常我们讲述的指标是指将业务单元精分后量化的度量值,譬如:DAU、订单数、金额等。当然,原子指标还会基于维度、修饰词、统计口径而构建出派生指标。指标的核心意义是它使得业务目标可描述、可度量、可拆解。2)什么是好指标好的数据指标是比较性的,可以是一个比率。因为比率的可操作性强、天生比较性指标、适用于比较各种因素间的相生和相克。例如:“本周转化率比上周高0.5个百分点”显然比“转化率为2%”更有

2020-09-30 15:16:47 2661

原创 数据挖掘怎么做关联性分析呢?

大家打开某宝,会发现,购物网站越来越懂我们了,推荐的商品正好就是我们想买的。其实这里面用到了数据挖掘中的关联规则,是典型的应用。类似应用还有很多,例如:资讯类APP的推荐(今日头条);微博推荐等。接下来我们以购物篮这个典型的应用来为大家介绍,在购物场景下,是如何做关联分析,并帮助购物者更快速买到自己想要的东西。全文讲解中所用到的产品是由亿信华辰提供的数据挖掘平台豌豆DM。整个过程分为以下几个步骤:应用目标:从订单数据集中找出关联度较高的商品。创建数据集下图的数据集为某商城的订单数

2020-09-30 15:14:52 3434

原创 如何建设数据仓库?

数据仓库的概念由来已久,相信大家早已不再陌生,其主要目的是为管理决策提供数据支撑和依据。于是数仓工具显得尤为重要。数据仓库概述数据仓库,顾名思义,就是存储数据的仓库。现实中的仓库会有不同的分区和归类,分区下有多个货架,货架上堆放着各种各样的商品。对于数据仓库来说,分区归类就类似于数据仓库的基础架构,数据仓库的数据存储结构(如表)就是仓库的货架,而商品则是对应数据仓库实际存储的各种数据。无论是什么样的仓库,无论仓库大小,其目的都是为了实现物品的集中管理、有序存取,数据仓库也是一样,它管理存储的是数

2020-09-30 15:13:22 909

原创 数据治理治什么?在哪治?怎么治?

近些年来,“数据治理”这个词总是高频出现,让人们对其“身世背景”格外好奇。国际数据治理研究所(DGI)给出的定义:数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁能根据什么信息,在什么时间和情况下,用什么方法,采取什么行动。what · 治什么?数据治理治的是数据吗?你大大的脑袋是不是有大大的困惑?要想回答这个问题,首先你得弄清楚数据是什么?数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记

2020-09-30 15:11:30 631

原创 得金融大数据者得天下,下一个一百亿市场在这里

在银行业每年高达千亿人民币的金融科技投入中,哪项新技术应用最广泛?答案是“大数据”。据互联网金融协会一份调研显示,在50多家调研银行中,高达98%已在多个场景中广泛应用大数据技术。这背后,是因为银行业天然离大数据最近:积累了海量数据、数据历史长、质量高、可挖掘空间大,银行经营的所有关键环节都离不开数据。为了打好这场大数据决战,国内外银行都毫不吝啬于配置大数据人才:美国富国银行号称有10000多名数据人员;国内一家国有行在总分行层面构建了一支450人的数据分析师队伍,从而满足大数据分析应用.

2020-09-30 15:02:22 349

原创 税收大数据透出经济发展新亮点

今年以来,税务部门坚决贯彻落实党中央、国务院决策部署,及时全面落实落细减税降费政策措施。上半年,全国累计新增减税降费15045亿元。税收大数据透出经济发展哪些新亮点?记者专访了国家税务总局党委书记、局长王军。三快一严!确保减税降费红包直接落到企业问:税务部门落实减税降费政策情况如何?采取哪些措施确保政策直达基层、直接惠及市场主体?答:我们把及时全面落实党中央、国务院减税降费的决策部署作为一项重大政治任务,层层压实责任,设法克服困难,确保直接惠及市场主体。具体有四个特点,即“三快一严.

2020-09-30 15:00:00 379

原创 大数据改变小生活,政务大数据能为我们带来什么?

当前大数据已正式成为各国国家战略,建设政务大数据平台不仅是国家大数据战略的重要项目,也成为智慧城市平台与体系建设的重要组成部分。平台构建并健全政务信息资源共享共用机制,支撑不同级别部门间信息资源跨越的协同管理与服务,通过大数据实现政务决策与管理,创新城市活力。政务是当前热门的大数据发展领域之一。然而,如同当年铺天盖地的智慧城市,政务大数据在落地实施时就埋下了虚无的种子。政务数据不局限于软件工程、信息技术,它是一门综合学科。首先,政务有鲜明的业务属性,离开具体业务的数据不是有效的政务大数据。其次.

2020-09-30 14:58:18 320

原创 扫清数据应用障碍,广东这家医院的做法让人拍手叫好

大数据正在改变各行各业,医疗行业也不例外。目前,医疗行业的发展面临着各种挑战,例如医疗数据分散存在于不同厂家开发的院内外多个子系统中,造成孤岛太多等。为保证医院各项工作顺利开展,医院也应顺应时代潮流,建立医院大数据平台,将医学技术水平与数据信息完美融合,不断完善医院数据处理与信息管理,提高综合服务水平。作为深化医疗改革的试点单位,广东某医院引入亿信华辰BI系统,建立医疗数据报表系统,提升医疗管理效率,促进医疗工作创新发展。数据困境:亟需挖掘数据价值广东某医院是我国近代史上最早的中医医院之一,其凭

2020-09-30 14:56:10 205

原创 赋能智慧金融,金融科技席卷银行业蓬勃发展

金融与生活“李先生您好,欢迎光临!”李伟是个心细的人,听得出来,工作人员的问候,不同于以往的“先生您好,欢迎光临!”这让刚刚迈步进入银行营业大厅的他感受到了未曾有过的亲切,心中泛起一丝喜悦,同时在心里为工作人员点了大大的赞。顺利地办完业务回到单位后,他向同事们提起此事。大家议论纷纷,七嘴八舌:“你听错了吧。”“对方准是认识你。”“下午我也去试试看能不能认出我。”“我前些天去银行也遇到了件有意思的事。”旁边听了很久的杨一突然说。原来他前些天去24小时自助银行取款,看到取款机显示屏幕上有个之前没见过的按钮“

2020-09-29 14:23:42 430

原创 通吃任何领域10个python可视化库,炫酷可视化再也不用怕

今天,我们将简要介绍10个跨学科的Python数据可视化库,从众所周知的到晦涩难懂的。我们注意到,使用Mode Python Notebooks可以轻松地在本地运行Python。Matplotlib两个直方图(matplotlib)matplotlib是Python数据可视化库中的泰斗。尽管它已有十多年的历史,但它仍是Python使用者最广泛使用的绘画库。其设计与20世纪80年代开发的一种专有编程语言----MATLAB非常相似。因为matplotlib是第一个Python数据可视化库,

2020-09-29 14:22:24 744

原创 数据分析做的好,这些策略不能少

大数据时代,不仅人人都是产品经理,还人人都是数据分析师,人们每天都在与各种各样的数据打交道,妥善归置自己身上的数据标签和数据信息。这是一个用数据说话的时代,也是一个依靠数据竞争的时代,大家相信得数据者得天下,目前世界500强企业中,有90%以上都建立了数据分析部门,绝大多数的政府单位也有专门的信息技术部门。然而数据分析究竟是什么?能给人们带来什么?我们应该如何做呢?且听小亿细细道来。道 · 数据分析的价值体系道,是战略,是形而上的价值体系。在数据分析领域,想要“悟道”,就要搞清楚他到底是什么,建

2020-09-29 14:21:08 266

原创 大数据在租赁行业如何应用,看交银租赁的信息化之路

日前,交通银行亮相中国国际服务贸易交易会,在交银金融租赁展示区中“飞机船舶资产监控系统”成功吸引众人眼球,通过触控大屏实现对交银金融租赁全球飞机、船舶的“一屏掌握”,让管理者“一目了然”,其系统为业内首创,成为服贸会上的“新晋网红”。随着金融科技的快速发展,各类金融机构都在积极拥抱变化,充分利用大数据技术所带来的红利。交银金融租赁有限责任公司(以下简称“交银租赁”)作为交通银行的全资子公司向来都是科技前沿的先行者,在公司成立之初就开启了信息化之路,在创新的数字化技术加持下,迎来业务的高速发展。交银租

2020-09-29 14:18:15 629

原创 华宇软件荣获全国信标委大数据标准工作组优秀成员单位

9月21日,2020全国大数据标准化工作会议暨全国信标委大数据标准工作组第七次全会在北京召开。会上,公布了“2019年全国信标委大数据标准工作组优秀专题组、优秀成员单位、优秀个人”并举行颁奖仪式,华宇软件荣获优秀成员单位,华宇软件智能数据产品总监訾津津荣获优秀个人称号。这是对过去一年华宇软件在此方面所做工作的有力肯定,也激励着华宇软件在未来的大数据探索和行业标准制定之路上发挥更大的潜能。华宇软件代表訾津津上台领奖(右三)华宇软件荣获优秀成员单位国务院发布的《促进大数据发展行动纲要》强调:

2020-09-29 14:17:41 233

原创 华宇智能数据官网全新上线,赋能行业数字化转型

十余年来,华宇深耕大数据领域不断提升自身能力,以“智慧+行业”为理念,“科技+服务”为导向,面向金融、财税、医疗卫生、政务、应急等行业提供专业咨询规划与技术支持服务,打造众多行业智能数据解决方案,助力政企数字化转型高效腾飞。这次官网全新上线(www.thunidata.com),为政企客户提供了一个深入了解华宇智能数据的新窗口,其背后蕴含的是华宇对自身服务体系的一次全面梳理和升级,既归纳总结了自身的服务能力,又进一步强化了服务生态、推动行业场景落地的决心和实践。(PC端和移动端同..

2020-09-29 14:17:00 576

原创 智慧医疗行业的数据解决方案怎么做

是最近兴起的专有医疗名词,通过打造健康档案区域医疗信息平台,利用最先进的物联网技术,实现患者与医务人员、医疗机构、医疗设备之间的互动,逐步达到信息化。医疗行业面临的问题1.医疗资源分布不均,医院各自为政;2.医疗数据分散,数据维护困难;3.标准复杂,缺乏统筹规划和统一管理;4.医疗体系效率低下;5.医疗服务质量不高;6.看病难看病贵问题突出智慧医疗通过感知医疗卫生对象,简化标准化医疗保健流程,实现全过程的医疗标准化流程、医疗对象管理、医疗保健安全和质量管理的目标。智慧医疗

2020-09-25 15:11:56 474

数据治理这件事其实没有那么难.docx

作为一名大数据产品工程师,拜读了很多关于数据管理方面的书籍,如大名鼎鼎的《DAMA数据管理知识体系指南》,再比如中国信息通信研究院和大数据技术标准推进委员会发布的《主数据管理实践白皮书(1.0版)》,对于数据治理更有了一些深刻理解,今天就以亿信华辰的一站式数据治理平台——睿治为载体,浅谈一下数据治理的框架以及如何进行。

2019-05-31

数据驱动,高效的数据质量管理才是是重中之重.docx

给领导汇报工作时,你是否对报告的基础数据质量产生过担忧,担心质量不达标呢? Collibra 一项调查发现,45% 的数据使用者称其报告基于的数据半数以上质量不够理想。 Gartner 2016 年的一项研究发现,由于数据质量差,受访组织平均每年将损失 970 万美元。 大数据时代数据的核心不是“大”,而在于“有价值”,而有价值的关键在于“质量”。

2019-05-31

数据可视化大屏设计好了之后如何零脚本快速实现?.docx

上次小亿和大家一起探讨过大屏可视化设计思路——《大屏可视化重头戏!你不看我不看,怎么会做好看》整篇文章从抽取关键指标、确定排版布局、定义配色风格、动画效果设计四个方面教大家如何设计一张酷炫的大屏。 那么大屏设计好了之后,如何实现?

2019-05-31

数据交换平台解决每天百亿条银行数据共享交换.docx

随着金融业务快速发展和产品创新驱动的要求,金融行业对数据的使用需求呈现爆发式增长,同时对数据的明细程度、采集类型、实时性和安全性等提出更高的要求,相应地金融行业数据架构必须随之进行匹配建设,需对整个企业的数据流转进行统一管理和规划。

2019-05-31

数据标准是个什么?这篇文章能解释清楚.docx

一、什么是数据标准 自己苦思不得,从茶水间回来后小菜终于忍不住了。 小菜:“哥啊,这个数据标准是什么啊?” 前辈:“数据标准就是数据的标准呗,就是给数据一个统一的定义,让各系统的使用人员对同一指标的理解是一样的。”

2019-05-31

什么是BI?商业智能战略和解决方案.docx

商业智能(BI)利用软件和服务将数据转换为可操作的情报,从而为组织的战略和战术业务决策提供信息。BI工具访问和分析数据集,并在报告,摘要,仪表板、图形、图表和地图中显示分析结果,为用户提供有关业务状态的详细信息。

2019-05-31

商业智能BI的三个应用层次,你用到哪个层次?.docx

经过几年的积累,大部分企事业单位已建立了比较完善的CRM、ERP、OA等基础信息化系统。系统运行一段时间后,必然收集大量的历史数据。但是,在数据库中分散、独立存在的大量数据对于业务人员来说,只是一些无法看懂的天书。此时,如何把数据转化为信息,使得业务人员包括管理者能够充分掌握、利用这些信息,并且辅助决策,就是商业智能(即BI)主要解决的问题。

2019-05-31

山东电力经研院:大数据开启智能电网规划之门.docx

近年来,国家电网公司积极推进信息化和智能电网建设,密切跟踪“大、云、物、移”等新技术发展趋势,提出构建“一平台、一系统、多场景、微应用”的大信息化平台,开展关键技术攻关,为坚强智能电网与世界一流现代公司持续创新发展奠定了坚实基础。作为国家电网的技术支撑单位,山东电力集团公司电力经济技术研究院(以下简称山东电力经研院)又是如何做的呢?本文以山东电力经研院为例,为您剖析电网企业的智能电网建设之路。

2019-05-31

如何制作出满意的Word式分析报告?.docx

作为 Office 套件的核心程序, Word 提供了许多易于使用的文档创建工具,同时也提供了丰富的功能集供创建复杂的文档使用。但在具体场景应用中,把Word 作为一种展示性的分析报告就存在一些不足。比如某政府部门每个季度都需要向领导汇报相关业务数据,每一期报告都需要编辑一份Word保存,不仅在存档管理上比较麻烦,查找原始数据也不方便,同时还需要处理各种数据,必要时不得不借助Excel。因此Word式分析报告就成为许多用户在进行数据挖掘和分析时的较大诉求。那么如何制作出满意的Word式分析报告呢?通过亿信华辰的拳头产品之一——数据分析展示平台亿信BI就可以,下面让小亿来具体介绍。

2019-05-31

如何利用WonderDM实现可视化数据探索和预处理.docx

跨行业数据挖掘标准流程(CRISP-DM)把完整的数据挖掘过程定义为六个标准阶段,分别是业务理解、数据理解、数据准备、创建模型、模型评估和模型应用。

2019-05-31

人均创利NO.1的交银租赁也在做智能报表系统.docx

以54家公司的可比数据计算得出,人均创收2670万元,人均创利接近450万元——2018年,金融租赁行业交出这样一份令人惊喜的成绩单。据悉,交银租赁凭借出色的净利润增速和超低的成本收入比,去年人均创利高达1363.5万元,远远高于其他公司,位居行业第一位。

2019-05-31

全力打造三型两网,再不搭建它就晚了.docx

2019年1月17日,国家电网三届四次职代会暨2019年工作会议提出,聚焦建设世界一流能源互联网企业,守正创新、担当作为,打造“枢纽型,平台型,共享型”企业,建设运营好“坚强智能电网,泛在电力物联网”,即为“三型两网”发展战略。

2019-05-31

潜心布局12年!揭秘这家智能数据公司的发展秘诀.docx

2006年,亿信华辰在北京正式成立。作为最早起步商业智能的厂商,今年已是亿信华辰成立12周年。 按常理,一个企业的创企和成立五周年、十周年都要举行隆重庆典,而亿信华辰从2006年10月31日在北京注册成立至今未曾举办过庆典活动。 作为年销售收入过亿的智能数据产品与服务提供商,在创立12周年以来却低调行事,对庆典活动淡然处之,难道是企业资本寒冬?究其原因,不过是源自亿信人的低调和归零的谦和心态。

2019-05-31

企业将增加领导驾驶舱和高级可视化的投资.docx

Dresner机构近日发布了一份《 2018 WisdomofCrowds®商业智能市场研究》。本年度,该调研机构评估了BI市场的用户发展趋势、用户对商业智能的态度以及应用目的。

2019-05-31

企业级数据应用难怎么破?一站式解决方案来了.docx

有这么一句话说的很好: 人与数据的距离远近,在于感知与驾驭。 而感知与驾驭的一种方式,便是先全量实时采集各类数据后,再使用工具智能化的获取信息,后通过大数据分析平台来展现和挖掘数据的深层次信息,从而实现数据本身所潜藏的价值。 高效选择大数据分析平台,首选亿信华辰的一站式解决方案。

2019-05-31

盘点:数据分析师必懂思维模型.docx

奋战在数据分析之路上的数据分析师们,经常会问“缺少数据思维,应该怎么办?”或是“我没有思维模型,怎么分析?” 首先,我们来为大家普及一下思维模型的概念:数据模型就是对现实世界抽象化的数据展示,数据模型在满足抽象的同时,越简单越好。以家族树形图谱为例,现实中人物的复杂关系,可以通过一个简单的树形结构清晰地表达出来,这就是一个数据模型。

2019-05-31

你以为建设大数据平台就好了,还差这一步.docx

长期以来,大家一直忽略一个问题:数据跟原来的企业应用系统一样,它是需要被管理的。企业逐渐了解数据所蕴含的价值,对数据的重视程度越来越高。于是乎,大家开始纷纷做数据治理。

2019-05-31

你的企业也需要它来做体检——指标管理平台价值解析.docx

指标直接反映企业的生产运营状况,为企业决策提供数据支撑。随着国家大数据战略与企业数字化转型的驱动,指标的作用越来越重要,指标管理上的诸多痛点让全企业统一的指标管理成为普遍需求。但要想把指标管理好并不容易,不仅需要科学合理的方法,还需要技术的强力支撑。

2019-05-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除