
看书笔记
Imflash
分享知识,分享快乐
展开
-
《大话数据结构》看书笔记--数据结构绪论
一. 数据结构绪论1.3 数据结构起源数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关问题的学科1.4 基本概念和术语数据描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合;分为数值类型和非数值类型数据元素是组成数据的,有一定意义的基本单位,在计算机中通常作为整体处理,也被称为记录...原创 2019-08-23 23:33:27 · 142 阅读 · 0 评论 -
《离线和实时大数据开发实战》_Hive原理实践_读书笔记
Hive原理实践Hive让数据的直接使用人员都能使用Hadoop的大数据处理能力,即使不会java编程1、离线大数据处理的主要技术:Hive1.2、Hive出现背景Hive是Facebook开发并贡献给Hadoop开源社区的;Hive是建立在Hadoop体系架构上的一层SQL抽象;Hive SQL是翻译为MapReduce任务后再Hadoop集群执行的,而Hadoop是一个批处理...原创 2019-08-28 20:08:50 · 691 阅读 · 0 评论 -
《离线和实时大数据开发实战》_Hive优化实践_读书笔记
Hive优化实践1. 离线数据处理的主要挑战: 数据倾斜"倾斜"指统计学历的偏态分布;所谓偏态分布, 即统计数据峰值与平均值不相等的频率分布根据峰值小于或大于平均值可分为正偏函数和负偏函数,其偏离的程度可用偏态系数刻画;Hive的优化正是采用各种措施和方法对上述场景的倾斜问题进行优化和处理2. Hive使用方面的优化对于大众的, KPI相关的指标等通常设...原创 2019-08-28 22:55:09 · 886 阅读 · 0 评论 -
《大话数据结构》看书笔记--算法
二. 算法2.1 两种算法的比较1+2+3+…+n=?暴力方法public long sum(long n){ long sum = 0L; for(long i =1; i<= n; i++){ sum =sum + i; } return sum;}合适方法public long sum(long n){ return (n ...原创 2019-09-11 20:22:42 · 214 阅读 · 0 评论 -
《大话数据结构》看书笔记--线性表
三. 线性表3.1 线性表的定义零个或多个数据元素的有限序列;3.2 线性表的顺序存储结构顺序存储定义指的是用一段地址连续的存储单元依次存储线性表的数据元素;描述顺序存储结构需要 个属性:存储空间的起始位置:数组 data ,色的存 位置就是存 空间的存储位置。线性袤的最大存储容量 数组长度 MaxSize;线性表的当前长度 length;在任意时刻,线性...原创 2019-09-11 20:31:14 · 222 阅读 · 0 评论 -
1、Apache Kylin概述(kylin权威指南)
概述本内容以Apache Kylin v1.5为基础1、背景和历史略2、Apache Kylin的使命Kylin的使命是超高速的大数据OLAP(Online Analytical Processing), 也就是要让大数据分析像使用数据库一样简单迅速,用户的查询请求可 以在秒内返回,交互式数据分析将以前所未有的速度释放大数据里潜藏 的知识和信息,让我们在面对未来的挑战时占得先机。...原创 2019-09-20 08:20:55 · 865 阅读 · 0 评论