定义:
-
统计学:
统计学是通过搜索、整理、分析、描述数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。 -
数据挖掘:
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。也可以叫数据深层采集,数据勘探,利用各种技术与统计方法,将大量的历史数据,进行整理分析,归纳与整合。 -
深度学习:
深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 -
机器学习:
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。
关系:
-
统计学主要利用概率论建立数学模型,是研究随机现象的常用数学工具之一。
数据挖掘分析大量数据,发现其中的内在联系和知识,并以模型或规则表达这些知识。
简单来说就是统计学分析的对象并不是很庞大,且有着针对性,而数据挖掘分析的对象很庞大,可能是GB或TB或更多,却并没有统计学那般有针对性。 -
数据挖掘,大部分核心功能的实现都以计量和统计方法作为支撑。统计学、数据库和人工智能共同构成数据挖掘技术的三大支柱。许多成熟的统计方法构成了数据挖掘的核心内容。如回归分析、判别分析、聚类分析、探索性数据分析、列联分析等统计方法&#x