
大数据
文章平均质量分 81
慧都大数据
以数据驱动发展,助力企业实现智能化,让数据实现最高业务价值!
展开
-
如虎添翼!Tableau成功收购Empirical Systems
6 月 13 日,Tableau 公司宣布其收购 Empirical Systems 的消息。 Empirical Systems 是一家领先的人工智能初创公司,诞生于麻省理工学院概率计算实验室(Probabilistic Computing Project)。Empirical SystemsEmpirical Systems 是一家诞生于麻省理工学院的人工智能初创公司,其自动化...原创 2018-06-21 14:22:04 · 425 阅读 · 0 评论 -
【Cloudera案例】利用工业物联网及机器学习技术使设备利用率翻倍
小松矿山公司(前身为 Joy Global 公司)是一家全球采矿设备和服务提供商,专 业提供能源、工业和硬质矿物开采的解决方案。面临的挑战小松矿山公司致力于帮助客户提高采矿作业的安全性、生产率,并降低成本。该 公司提供名为 JoySmart Solutions 的工业物联网(IIoT)服务,利用从智能连接的各种设备和资产中所获取的实时数据和分析,帮助客户优化机器性能。该应用程序中的设备和资...原创 2019-01-08 14:32:54 · 550 阅读 · 0 评论 -
2019年实现分析和数据仓库现代化的三大趋势
今年数据分析的优先事项发生了变化。增长因素和业务优先级不断变化。不要眨眼,否则您可能会错过领先的组织正在进行的现代化分析和数据仓库环境。商业智能(BI)是由Dresner Advisory Services首席研究官Howard Dresner于1989年创造的一个总称,指的是最终用户访问和分析企业数据的能力。根据Dresner的说法,在2018年12月的网络研讨会上,2018年进行的新的初步...翻译 2019-01-14 11:21:06 · 1112 阅读 · 0 评论 -
【Cloudera案例】应用于中联重科制造业大数据成功案例
中联重科是国内领先的工程机械、农业机械等高新技术装备研发制造商,为全球6大洲100多个国家的客户创造价值。在近年来日益严峻的市场环境下,中联重科在利用大数据平台实现智能化转型升 级之路上不断探索。部署Cloudera企业级之后,该公司有效降低了自身服务成本,同时提升了设备租赁服务、二手设备交易以及零配件销售等后市场的服务收益,实现了向“产品在网上、数据在云上、服务在掌上”的新商业模式转型升...原创 2019-01-15 11:06:55 · 1857 阅读 · 0 评论 -
干货|简单易懂的深度学习指南之认识深度学习!
如今大家都在说深度学习。它改变了游戏规则。 它改变了你的生活。 它改变了所有一切。 它将改变这个世界。人们往往为技术而兴奋。但深度学习是企业用来解决实际问题的工具。仅此而已, 毋庸夸大,也无需贬低。在本文中,第一部分将首先将介绍深度学习及其基础,作为我们学习的第一部分。第二部分,我们将介绍 Cloudera 数据和机器学习的统一平台,并提供六个实用技巧,帮助您的组织开始进行深度学习...原创 2019-03-06 14:58:55 · 534 阅读 · 0 评论 -
干货|简单易懂的深度学习指南之实用技巧!
在上一节的学习中,我们主要认识了什么是深度学习,深度学习有哪些成功的应用以及深度学习的优点与缺点,总体来说就是让我们深度的了解何为深度学习,就如文字开头所说的“人们往往为技术而兴奋。但深度学习是企业用来解决实际问题的工具。仅此而已,毋庸夸大,也无需贬低。”对于还不了解什么是深度学习的朋友可以先阅读《干货|简单易懂的深度学习指南之认识深度学习!》学习一下。本篇文章我们不在对深度学习的基础做讲...原创 2019-03-06 15:02:30 · 304 阅读 · 0 评论 -
干货|50个大数据面试问题及答案第一篇:10个大数据面试入门级问题
大数据时代才刚刚开始。随着越来越多的公司倾向于大数据运营,人才需求达到历史最高水平。这对你意味着什么?如果您想在任何大数据岗位上工作,它只能转化为更好的机会。您可以选择成为数据分析师,数据科学家,数据库管理员,大数据工程师,Hadoop大数据工程师等。在本文中,慧都网将介绍与大数据相关的前50大数据面试问题。50个最受欢迎的大数据访谈和面试问题为了使您的职业生涯更具优势,您应该为大数据面...原创 2019-03-07 13:12:19 · 16487 阅读 · 1 评论 -
干货|50个大数据面试问题及答案第二篇:10个大数据面试中级问题
上一篇文章我们总结了10个大数据面试入门级问题,大家是否有收获,如果还没有看的小伙伴,可以直接跳转《干货|50个大数据面试问题及答案第一篇:10个大数据面试入门级问题》开始学习吧!本次我们慧都网分析的是10个已经在大数据行业工作的老司机们面试时的问题及建议答案,话不多说,赶紧开始今天的学习。基于大数据已从业者的面试问题如果您在大数据世界中有相当丰富的工作经验,那么根据您以前的经验,...原创 2019-03-07 13:14:08 · 13794 阅读 · 3 评论 -
这5种数据挖掘技术,大数据玩的贼溜!
数据挖掘涉及“处理数据和识别信息中的模式和趋势”,根据IBM所说,“数据挖掘原理已经存在了许多年,但是随着大数据的出现,它更为流行了。”IBM估计,仅过去的两年就产生了世界上百分之九十的数据。每天人们产生2.5兆字节的数据,足以填满1000万个蓝光光盘。数据挖掘技术帮助专业人员了解可用数据集。这些技术可以为企业和其他组织提供描述性和预测性的能力。5个数据挖掘技术01关联规则...原创 2019-03-15 11:44:14 · 898 阅读 · 0 评论 -
干货|50个大数据面试问题及答案第四篇:10个Hadoop开发人员新手面试问题
还是接着上次分享的内容开始,如果还没有看过前三期的小伙伴,可以根据自己的需要自行观看。《干货|50个大数据面试问题及答案第一篇:10个大数据面试入门级问题》《干货|50个大数据面试问题及答案第二篇:10个大数据面试中级问题》《干货|50个大数据面试问题及答案第三篇:10个大数据Hadoop面试问题》马上开始我们今天的分享,祝您在面试的时候能有所帮助!10个Hadoop开发人员...原创 2019-03-11 14:53:33 · 785 阅读 · 0 评论 -
干货|50个大数据面试问题及答案完结篇:经验丰富的Hadoop开发人员面试问题
截止到现在我们已经更新了四期,涵盖了大数据新人面试、大数据经验者面试、大数据hadoop面试和hadoop开发新人面试四个板块,如果对其中的版块有兴趣的小伙伴,点击下方文章跳转观看。《干货|50个大数据面试问题及答案第一篇:10个大数据面试入门级问题》《干货|50个大数据面试问题及答案第二篇:10个大数据面试中级问题》《干货|50个大数据面试问题及答案第三篇:10个大数据Hadoop...原创 2019-03-12 10:49:59 · 1123 阅读 · 0 评论 -
Top10:大数据的十大流行误区,你中了几个?
技术和科学每天都在观察革命性的进步,企业正在努力从中汲取最大的利益。数据分析是这样一个领域,他们利用大数据和数据科学,将大量数据与业务战略相结合。实际上,大数据对所有企业都有合理的承诺,无论其规模如何。通过大数据分析,企业可以获得洞察力,帮助他们不仅可以增加收入,还可以了解他们的服务和产品中的差距。让我们来看看最常见的大数据误区作为一项不断发展的技术和相对较新的概念,大数据其实存在...原创 2019-03-12 14:39:22 · 380 阅读 · 0 评论 -
干货|50个大数据面试问题及答案第三篇:10个大数据Hadoop面试问题
在上两次文章中我们慧都网给大家分享了,对于刚刚从事大数据行业和已从事大数据行业的面试者可能会遇到的专业面试题20道,如果还没有阅读的朋友可以跳转观看哦!《干货|50个大数据面试问题及答案第一篇:10个大数据面试入门级问题》《干货|50个大数据面试问题及答案第二篇:10个大数据面试中级问题》10个大数据Hadoop面试的专业问题Hadoop是最受欢迎的大数据框架之一,如果您正在进行...原创 2019-03-08 11:29:24 · 1130 阅读 · 0 评论 -
【干货分享】6个Java开发人员最受欢迎的大数据工具,Hadoop竟被称为“圣经”
Java已经在技术领域工作了20多年,成为最“热爱仇恨”的技术。如果仔细观察各种编程语言,操作系统和数据库,过去几年几乎没有什么变化。随着具有大数据和物联网的新技术空间的发展,我们可以看到很多进步。但是,Java仍然是Java开发人员许多大数据工具的支柱。实际上,它非常适合大数据,因为Java开发人员的大数据工具的一些核心模块是用Java编写的。更有趣的是,Java开发人员的大多数这些大数...原创 2019-03-13 14:35:56 · 350 阅读 · 0 评论 -
速速收藏!使用Apache Spark实现ETL 300%的速度提升
当技术团队开始将现有系统和EDH(企业数据中心)集群拼接在一起时,通常会采用以下常见的设计模式:将文件转储(通常为CSV格式)定期上传到EDH中,接着进行解压缩,转换为最佳查询格式,然后隐藏在HDFS中,在这里各种EDH组件都可以使用它们。当这些文件转储很大或很经常出现时,这些简单的步骤可能会显著减慢数据撷取管道的速度。这种延迟的一部分是不可避免的;由于物理限制因素,跨网络移动大文件是非常耗时...翻译 2019-03-18 16:00:21 · 1250 阅读 · 0 评论 -
推动AI工业化——Cloudera推出云原生机器学习平台的预览版
2018年12月5日,Cloudera公司,为云计算优化的机器学习和分析的现代平台,宣布推出由Kubernetes支撑的新一代云原生机器学习平台的预览。即将推出的Cloudera Machine Learning是Cloudera为企业提供的自助数据科学产品的新成员。它提供快速配置和自动扩展以及异构计算上的容器化分布式处理。Cloudera Machine Learning还通过跨内部部署、公共云...转载 2018-12-10 17:22:44 · 299 阅读 · 0 评论 -
干货|Cloudera信用卡欺诈数据分析(视频)
本视频讲解及演示在Cloudera Data Science Workbench 平台上以著名机器学习竞赛平台Kaggle数据为基础,包含前期数据探索,规划展示,模型训练、优化、最终部署的一个全流程的数据及学习的Demo。主讲人:陆锋本Demo采用Kaggle平台欧洲信用卡持卡人在2013年9月的284,807条数据交易记录为依据,在CDSW平台运行及部署Model文件实现反欺诈监测。...转载 2018-12-20 15:25:55 · 309 阅读 · 0 评论 -
新闻 | Hadoop开源技术领域的行业变局
当行业排名前两位的企业选择合并,往往意味着垄断巨头的出现和某种模式下市场竞争的告一段落。不久前,Cloudera和Hortonworks的宣布合并,让大数据领域的竞争也变得扑朔迷离。两家上市公司为什么要合并?对Hadoop这又意味着什么?都是值得思考的问题。Hadoop的商业化Hadoop几乎可以算作大数据的代名词,随着开源技术的被广泛使用,Hadoop已经成为事实上的大数据标准。...转载 2018-11-30 16:30:45 · 267 阅读 · 0 评论 -
人类辩手竟被辩论型AI机器人击败!
IBM在研究对话式人工智能多年,此前推出了“沃森”,近日IBM办公室最新推出的AI系统Project Debater,在一场辩论赛中击败了人类顶尖辩手!Project Debater的对手是以色列国际辩论协会主席Dan Zafrir和2016年以色列国家辩论冠军Noa Ovadia。据IBM介绍Project Debater是第一个可以在复杂话题上与人类辩论的AI系统。 P...原创 2018-06-22 10:31:29 · 928 阅读 · 0 评论 -
BI和大数据你能分清吗?
慧都网——提供企业信息化整体解决方案BI(Business Intelligence),中文翻译是商务智能,是一套完整的解决方案,用来将组织中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助组织做出明智的业务经营决策。(慧都大数据)商业智能能够辅助的业务经营决策,既可以是操作层的,也可以是战术层和战略层的决策。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数...原创 2018-06-25 10:22:31 · 358 阅读 · 0 评论 -
阿里巴巴将拓展欧洲市场,大数据需求依然离不开中国消费者!
2015年3月5日阿里巴巴宣布,阿里云将在美国硅谷兴建数据中心。那时标志着该公司的云业务第一次进军海外。时隔3年2018年的现在诸如Zalando和ASOS等许多欧洲在线零售巨头都在密切关注阿里巴巴进军世界其他地区的计划,更不用说美国的亚马逊和eBay了。具慧都网小编了解与此同时,阿里巴巴正在欧洲各地发展自己的团队。最近,该公司在伦敦的总部搬到了科文特花园(Covent Garden),新增加了6...转载 2018-06-26 14:25:43 · 405 阅读 · 0 评论 -
BI商业智能“四大天王”
本资料来源于慧都大数据网:http://bigdata.evget.com/基于云部署的现代商业智能与数据分析平台(国内似乎只有应用上云,数据本地化的趋势)正在逐步占据主流市场。随着市场在易用性和增强分析(augmented analytics)的变革,数据与分析领导者正在逐步升级传统解决方案或扩展新的BI产品。作为大力发展BI产品的慧都网: https://www.evget.com/,现已经与...原创 2018-06-20 11:56:44 · 537 阅读 · 0 评论 -
存储新纪元:在DNA存储海量信息,商业化才是硬道理
概述:如今,将数据信息存储在DNA上的成本已经足够便宜,因此该技术有望实现商业化。数据已经是21世纪不可或缺的东西,当然数据存储也就成了人们重点关心的,没有足够的容量去存储,数据不断的流失这也是很大的损失。我们需要承认这样一个事实:我们已经成为数码囤积者,耗费大量的空间来存储我们的数据。2016年,人类共计产生了16.1万亿GB的数字信息;到2025年,这一数字预计将增加十倍以上。我们的个人照片、...原创 2018-07-02 11:06:45 · 1040 阅读 · 0 评论 -
注意!现代数据环境中需转变的三大思维
概述:为组织提供可靠的数据来协助制定更明智的决策,这是几十年来未曾根本改变的任务。尽管 IT 行业涌现出大量的技术进步和新方法,但是负责管理数据基础架构的 IT 组织今天仍然具有相同的总体使命:在数据创建时就能移动数据,使决策制定者在需要时能够访问和理解这些数据。近年来出现了大量的新数据源,它们生成了前所未有的庞大输出量,并且输出内容通常结构化程度不高甚至没有任何结构,这可能是现代数据环境中存在的...原创 2018-07-03 11:35:24 · 288 阅读 · 0 评论 -
Exactis大数据公司失误泄露2TB隐私信息:涉及2.3亿人
据外媒Wired报道,本月初曝光的市场和数据汇总公司Exactis服务器信息暴露的事情经调查为实。Exactis采集了大约3.4亿条记录,大小2TB,可能涵盖2.3亿人,几乎是全美的上网人口。Exactis此次的信息泄露并不是黑客撞库引起或者其它恶意攻击,而是他们自己的服务器没有防火墙加密,直接暴露在公共的数据库查找范围内。最早发现的安全研究员Vinny Troia称,他想搜索的所有人的资料都可以...原创 2018-06-28 11:26:01 · 1873 阅读 · 0 评论 -
【大数据案例】人工智能助力城市交通智慧化发展——挖掘多源数据破解城市“堵局”
众所周知,城市交通是城市活动的重要组成部分,犹如人体的动脉,维系着整个城市的正常运转。随着人口的增多、科技 的进步和城市规模的扩大,交通方式由原来简单的车马舟船,演变为现在的火车、汽车、地铁、飞机等各种综合型的运输 方式。交通作为现代城市的重要体现和标志 ,见证着每一个城市的历史与文明、发展与兴衰。城市交通不仅仅是一个市政 工程问题或交通技术问题,而且是一个综合性的社会问题。然而,随着城市...原创 2018-10-17 16:49:58 · 2285 阅读 · 0 评论 -
新闻 | Cloudera发布人工智能工业化的愿景
Cloudera,Inc(纽交所股票代码:CLDR)是为云优化的机器学习和分析的现代平台,近日宣布了加速企业机器学习和人工智能工业化的战略愿景 – 构建,扩展和部署企业机器学习的自动化,可重复性和可预测性。通过Cloudera的机器学习平台,Cloudera 数据科学工作站 (CDSW) 开发环境以及应用AI建议和研究产品,Cloudera使数百家企业能够从他们的数据中获得更深入的洞察力,...转载 2018-10-29 11:37:01 · 219 阅读 · 0 评论 -
【干货】非常实用的Cloudera平台参考部署架构
Cloudera平台软件体系结构Cloudera的软件体系结构中包含了以下模块:系统部署和管理,数据存储,资源管理,处理引擎,安全,数据管理,工具库以及访问接口。一些关键组件的角色信息:硬件配置集群服务器按照节点承担的任务分为管理节点和工作节点。管理节点上一般部署各组件的管理角色,工作节点一般部署有各角色的存储、容器或计算角色。根据业务类型不同,集群具体配置也有所区别:...原创 2018-10-29 16:00:55 · 965 阅读 · 2 评论 -
实用|工业大数据具体解决的实际应用问题
如今大数据如火如荼,从起初的看似概率一样的词语,到现在不管是教育、金融、制造业等各个行业都在往大数据这个方向前进。但具小编了解目前大数据的行业应用上却存在很多问题,特别是制造业大数据,在整个价值链中面临的最关键挑战,洞察力埋藏在数据孤岛中,无法为其所用,因此只有通过数据驱动的洞察力提高生产力和质量,才能让企业实现精准数据管理分析、准确管理设备健、真正实现计划生产、增强产品质量控制、企业资源利用最大...原创 2018-10-31 14:25:55 · 446 阅读 · 0 评论 -
Cloudera|传统数据库向大数据的渐进式转型
数据仓库系统长期以来一直是企业 IT 架构的重要组成部分。随着开源技术的不断发展以及云端部署方式的不断深入,传统数据仓库的局限性日益凸显,难以适应新技术带来的市场变革,如何面向大数据技术进行数据仓库的优化、转型是企业 IT 管理者面临的重要挑战。处于不同阶段的企业如何应用大数据技术?如何面向大数据技术进行数据仓库转型?如何对现有数据仓库进行优化?如何在 Hadoop 中进行性能优化?这些已成为困扰...转载 2018-11-05 11:44:38 · 945 阅读 · 0 评论 -
【速看】学习如何保护Hadoop集群免受恶意软件攻击!
有两个新的恶意软件,XBash和DemonBot,是针对Apache Hadoop服务器比特币挖矿和DDOS目的。这种恶意软件疯狂扫描互联网寻找Hadoop集群,当有未设安全的集群连接到公共互联网上,几分钟内便可被感染。本文将描述此恶意软件使用的机制,并提供保护的Hadoop群集的相应操作。Hadoop的恶意软件的历史大约两年前,对开源数据库解决方案的MongoDB以及Hadoop的发...转载 2018-11-16 16:13:20 · 306 阅读 · 0 评论 -
Cloudera助力英国银行Santander新一代数据仓库诞生!
Santander UK的大数据之旅始于四年前。他们是Apache Kafka等新数据流技术的早期采用者,希望通过对移动用户使用实时数据和应用内分析来彻底改变客户体验。从那时起,Santander UK通过大数据技术增强了创新能力,得到了迅速发展。对大规模流式分析的需求大为增加并成为当下需求。今天,在Santander UK,Cloudera的大数据,机器学习和分析平台通过Apache K...转载 2018-11-20 11:33:00 · 333 阅读 · 0 评论