2、统计与机器学习数据挖掘:从PC到EDA的变革之旅

统计与机器学习数据挖掘:从PC到EDA的变革之旅

1. 个人计算机与统计学

个人计算机(PC)给统计学领域带来了翻天覆地的变化,可谓利弊共存。一方面,PC 能轻松完成精确计算,减轻了统计计算的负担。只需掌握基本的统计软件编程知识,告知软件输入数据的位置、所需的统计程序和计算方式以及输出位置,像测试分析、原始数据汇总制表等统计任务就能轻松完成。PC 还推动了决策过程中的统计思维,通过可视化展示,如柱状图、折线图、动态三维旋转图以及管理演示中的交互式营销模型,让统计结果更直观。同时,它也方便了支持文档的制作,可将统计软件的输出复制粘贴到演示应用中。但另一方面,PC 与统计学的结合也让一些统计基础薄弱的通才摇身一变成为“准统计学家”,使他们产生了一种虚假的自信。例如,计算平均利润是商业中的常见操作,但只有当数据分布对称时,均值才能代表“典型值”。在营销数据库中,利润分布通常是右偏的,所以平均利润并非可靠的汇总指标,而那些“准统计学家”可能根本意识不到这一点,导致对平均利润的解读毫无价值。

另一个例子是无处不在的相关系数,它是仅次于均值的常用汇总指标,用于衡量两个变量之间的关联。然而,要正确解读相关系数,需要满足一个假设,即两个变量之间的关系是线性的。但很少有“准统计学家”能意识到这个假设,就连训练有素的统计学家也常常因不加批判地使用 PC 进行统计分析而忽略了这一点。

专业统计学家也因 PC 的强大计算能力而受益。没有 PC,统计分析的自然七步循环将难以实现。这七步循环如下:
1. 问题定义 :确定解决问题的最佳方法并非易事。管理目标通常以定性方式表达,此时结果或目标(因变量)的选择可能存在主观偏差。当目标明确时,合适的因变量可能又无法获

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值