
大数据
CoffreLv
平平淡淡,简简单单。
展开
-
大数据学习——Day7(SPSS制作直方图、箱型图)
SPSS制作直方图、箱型图选中数据→\rightarrow→图形→\rightarrow→旧时对话框→\rightarrow→直方图→\rightarrow→设置→\rightarrow→确认选中数据→\rightarrow→图形→\rightarrow→旧时对话框→\rightarrow→箱型图→\rightarrow→设置→\rightarrow→...原创 2020-05-19 11:59:02 · 3395 阅读 · 1 评论 -
大数据学习——Day6(数据的分布和展示)
数据的分布和展示数据的分布数据的偏态数据的峰度数据的展示条形图扇形图折线图直方图盒式图Excel实现数据展示数据的分布数据大致形态、形态分析特征数据的偏态 - 数据不对称性分布——偏斜方向和程度(右(正)向偏态、左(负)向偏态) - 数据对称分布——平均数 = 中位数 = 众数 - 偏态系数SK 
软件计算描述性数据Excel统计分析SPSS统计分析Excel统计分析文件→\rightarrow→选项→\rightarrow→加载项→\rightarrow→管理(Excel加载项)→\rightarrow→转到→\rightarrow→分析工具库数据→\rightarrow→数据分析→\rightarrow→描述统计→\rightarrow→设置统计参数→\rightarrow→确定SPSS统计分析设计数据视图→\rightarrow→导入变量→\rightarrow→选中统计区域→原创 2020-05-19 11:19:57 · 202 阅读 · 0 评论 -
大数据学习——Day4(数据分析基础、数据的趋势)
Day4(数据分析基础、数据的趋势)数据分析基础数据分析流程数据分析方法基础工具数据的趋势统计中的简单概念集中趋势离中趋势数据分析基础数据分析流程目的和内容:项目-整体框架、业务问题-分析对象数据收集:准确、有效(SQL语言)数据预处理:检验、清洗数据分析:方法、软件数据表现:表、图形数据报告:整体框架、结论、建议、解决方案数据分析方法预处理加工:描述性统计分析(趋势、分布);相关分析(单一、多个、相关系数)基于梳理统计:方差分析、回归分析、因子分析数据挖掘:- 聚类分析(层原创 2020-05-19 11:06:02 · 348 阅读 · 0 评论 -
大数据学习——Day02(数据仓库)
数据人对客观事物的观察在大脑中产生的一种记忆,如视频、图像、声音、文字等。数据的意义通过对一定量的数据的分析,所得出的规律可以指导实际活动,从而使实际活动更加容易。一般数据越多,规律越多,越准确。大数据计算机的出现,使对于数据的计算与存储不在局限于人脑和之前实体的记录方式(纸笔等),计算机可以存储更大量的数据。大数据的出现,与1类似,对于更更大量的数据,我们需要更快更准确的计算和更大的存储容量。定义: 当前的技术无法进行处理和分析的数据量。关键词: 服务器、服务器集群、分布式重点理原创 2020-05-14 11:02:03 · 245 阅读 · 0 评论 -
SQL基础学习笔记——Day01
SQL DML 和 DDLSQL 可以分为两个部分:数据操作语言 (DML) 和 数据定义语言 (DDL)。查询和更新指令构成了 SQL 的 DML 部分:SELECT - 从数据库表中获取数据UPDATE - 更新数据库表中的数据DELETE - 从数据库表中删除数据INSERT INTO - 向数据库表中插入数据SQL 的数据定义语言 (DDL) 部分使我们有能力创建或删除表格。我们也可以定义索引(键),规定表之间的链接,以及施加表间的约束。SQL 中最重要的 DDL 语句:CRE原创 2020-05-13 12:12:32 · 166 阅读 · 0 评论 -
大数据学习——Day01(基础常识和数仓基础)
大数据定义现有技术无法处理的数据。主要特点体量大要求处理速度快数据种类多发展历程数据–>存储、计算数据–>分布式计算大数据处理技术的发展历程谷歌提供了理论支撑:GFS、MapReduce和BigTable。hadoop:大数据处理平台,将分布式计算打包,降低了分布式编程的难度。数据仓库Hive数据仓库中的一个非常重要的技术,是数据仓库与hadoop紧密结合的标志。学习硬件需求服务器集群(vmware,购买云服务器集群,购买服务器)技术软件需求存储 :H原创 2020-05-13 12:01:52 · 226 阅读 · 0 评论