数据分析基础知识复习

本文介绍了数据分析的基础知识,包括数据分析的目的、环境和常用模型。重点讨论了回归模型、逻辑回归、随机森林、GBDT、神经网络、SVM和聚类分析等,并阐述了它们在实际业务中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

数分析基础知识

从广义的角度,数据分析分为三个方面体包括** ‘数据分析’,‘数据挖掘’,‘模型算法’**。

数据分析:偏重于数理统计,用统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论。

数据挖掘:指从大量的数据中通过算法搜索隐藏于其中信息的过程,一般这个过程是计算机来实现。最经典且流传已久的数据挖掘成功案例:"尿布与啤酒"的故事。

数据分析使用环境

数据分析在具体业务中的使用环境:

①业务逻辑清晰,指标明确。
例如:我要分析某网店营销情况,指标:销售额= 人均金额 X 人数,消费人数 = 浏览过的人数X 留存率
浏览记录人 = 平台面向的人群数X 进店比率

②可以转为恰当的数据,数学,统计问题。

③有足够的数据支撑。

④熟悉模型,分析方法的局限性:每个模型都有其局限性。

⑤从场景中来,到场景中去。

数据分析目的

挖掘规律,验证猜想,进行预测

#数据获取途径

  • 公开信息:上市公司年报,统计局信息,外部数据库;

  • 非公开信息公司自有数据库,调查问卷,客户数据

数据清洗

保证数据可读性,数据完成性,数据唯一性,数据唯一性,数据合法性

#数据

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值