
大数据
Bella人工智能爱好者
好好学习,天天向上
展开
-
菜鸟窝大数据课程(免费试听):Linux基础课程
以下是大数据学习的基础入门内容:linux操作系统,免费试听可以联系助教Andy的微信:Cainiao168 ,免费领取本课程视频。Linux来源与发展状况Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。它能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了Unix以...原创 2019-07-23 18:07:13 · 391 阅读 · 0 评论 -
30岁还只懂coding,是因为热爱吗?
20岁只懂编程是热爱,30岁只懂编程是专业,那么35岁、40岁呢?我们通常开玩笑程序员的天敌是产品经理,双方在各社交平台上互相口诛笔伐,而实际上他们确实也势如水火,产品经理经常会赶在临近下班前,用一种叫“改需求”的不明武器,无限延长你的加班时长。但是很多程序员的问题是他们对于产品经理提出的任何需求,都不能以具体的道理反驳,而只是以直觉说:『我觉得不行』、『我觉得用户没有这个需求』、『我不管我不...原创 2019-09-02 14:14:11 · 311 阅读 · 0 评论 -
Flink入门视频教程(菜鸟窝出品)
课程背景Apache Flink是由Apache软件基金会开发的开源流处理框架,其核心是用Java和Scala编写的分布式流数据流引擎。Flink以数据并行和流水线方式执行任意流数据程序,Flink的流水线运行时系统可以执行批处理和流处理程序。此外,Flink的运行时本身也支持迭代算法的执行。近年来,Flink的大有逐步取代storm以及sparkstreaming之势,本课程将为你讲解Fli...原创 2019-09-02 10:48:34 · 3094 阅读 · 0 评论 -
’Hive快速入门课程视频【菜鸟窝出品】
课程背景Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析 。Hive是工作中最常用到的部分,也是面试的重点。本课程将由11年软件开发经...原创 2019-09-02 09:42:12 · 909 阅读 · 0 评论 -
【干货分享】C4.5算法(上)
今天跟大家分享一下C4.5算法相关内容,内容有点多,会分上下两篇写简介一种分类决策树算法,对海量数据集进行分类和回归。其核心算法是ID3算法.,对ID3算法进行了改进:1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;2) 在树构造过程中进行剪枝;3) 能够完成对连续属性的离散化处理;4) 能够对不完整数据进行处理。优点:产生的分类规则易于理解,...原创 2019-08-27 13:47:03 · 734 阅读 · 0 评论 -
移动互联网十年的光景太短了,后端技术才是真正可长期发展的方向
重大消息!菜鸟窝大数据讲师团队又迎来一位重量级讲师,他就是Dico,从业8年以来,Dico一直深耕于大数据技术,从一名大数据工程师逐步成长为一名大数据架构师,谈起他的心路历程,他说了三个词**“缘分、试错、执着”。**正是他前瞻性的眼光,让他成为一名大数据领军人物。现任职芒果TV大数据研发中心高级架构师,主导了芒果TV数据仓库建设、画像平台建设和推荐平台建设。在采访中,Dico老师分享了自己...原创 2019-08-21 14:53:36 · 476 阅读 · 0 评论 -
一线大厂解读:最懂你的推荐系统,是怎么搭建的?|菜鸟窝大数据精华公开课
获取信息是人类认知世界、生存发展的刚需,搜索和分类导航是比较常用的方式,比如聚餐想吃火锅的时候会在大众点评输入火锅检索,搜索引擎会根据价格、地点、好评率等因素综合排序,给你一个最匹配的结果。这是一种主动获取信息的方式。但很多时候会出现这种情况,你的浏览行为是无目的性的,比如看淘宝主页的猜你喜欢、百度封面的推荐阅读、刷抖音时接连出现的视频……在大数据环境下,这种被动接受信息的懒人式信息获取方式被...原创 2019-08-21 13:48:01 · 401 阅读 · 0 评论 -
25款大数据入门与实战电子书+视频教程(全程干货)
本资源由菜鸟窝大数据教研团队整理的,共有1.3GB学习资源(电子书)含Hadoop大数据与挖掘实战、Hbase实战、Spark大数据处理技术、Spark高级数据分析、大数据存储MongoDB实战、大数据架构师指南、数据算法、大数据挖掘等25本必读电子书~以及10个入门到实战的视频教程,勾搭助教weixin:BT474849 免费领取哦~...原创 2019-08-06 14:47:45 · 802 阅读 · 0 评论 -
大数据Spark:从入门到实战(附视频教程&项目源码)
本文是由菜鸟窝出品的12天大数据特训营课程摘录出来的,关于大数据spark的入门到实战视频可以戳此查看第三章:https://www.cniao5.com/course/10244勾搭助教Bella的weixin(BT474849)还可以免费领取大数据独家内部视频资源,项目源码等。一、Spark简介1、大数据spark简介:Spark是大数据相关的最活跃的开源项目,是继 MapReduce...原创 2019-08-05 17:58:41 · 7770 阅读 · 0 评论 -
大数据Spark:从入门到实战(理论和实战相结合,附上视频教程&项目源码)
本文是由菜鸟窝出品的12天大数据特训营课程摘录出来的,关于大数据spark的入门到实战视频可以戳此查看第三章:https://www.cniao5.com/course/10244勾搭助教Bella的weixin(BT474849)还可以免费领取大数据独家内部视频资源,项目源码等。一、Spark简介1、大数据简介:Spark是大数据相关的最活跃的开源项目,是继 MapReduce框架之后...原创 2019-08-05 18:01:12 · 855 阅读 · 1 评论 -
【菜鸟窝】Hadoop生态系统、Hadoop虚拟机环境准备、Hadoop环境搭建(含安装包和教程)
hadoop环境搭建视频:https://www.cniao5.com/course/lessons/102441.1Hadoop简介1.1.1Hadoop的诞生Hadoop是由Apache Lucene创始人Doug Cutting创建的。它起源于开源搜索引擎Apache Nutch。Nutch项目开始于2002年,是一个可以运行的网页爬取工具和搜索引擎系统,但是这个系统无法解决数十亿的搜...原创 2019-07-31 10:48:02 · 1677 阅读 · 0 评论 -
java转大数据,菜鸟窝零基础大数据从入门到实战!
<人物专访>做了几年JAVA了,前端后端都做过些项目,最近公司准备上马一个大数据项目,让我来负责,一方面因为我对大数据正好有兴趣,一直找不到机会学习(没有动力啊~),这次机会算是撞上了。但另一方面,其实我的大数据经验只是在虚拟机/aws和openstack上搭建word count的水平上,基本算是0基础起步。虽然我自信JAVA基础还行,但在自学大数据途中我发现,大数据实在太庞大了...原创 2019-07-25 17:41:41 · 805 阅读 · 0 评论 -
【干货分享】C4.5算法(下)
本篇文章是☞【干货分享】C4.5算法(上)的下篇,没看过的学员请移步。属性集有四种:天气,温度,适度,风速类标签集合两种:进行取消步骤:1.计算信息熵2.分别计算按不同属性的划分信息熵3.计算出信息增益4.计算增益信息5.计算信息增益率6.重复1-5计算出不同属性划分的信息增益率1.计算信息熵Info(D) = -9/14 * log2(9/14) - 5/14 * log...原创 2019-09-03 10:23:22 · 663 阅读 · 0 评论