统计学系列:统计、数据与思想

统计学是关于数据的科学,包括描述统计和推断统计。描述统计关注数据的集中趋势、离中趋势和相关性分析,而推断统计则利用样本数据推断总体特征。数据收集方法有观察、公开资料、调查、实验和爬虫等。非随机样本可能导致选择偏差、无应答偏差和测量误差,需谨慎处理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

  统计(statistics)是数据的科学,涉及数据的收集、分类、汇总、组织、分析以及数字信息的解释。统计分为两种:描述统计和推断统计。
  
  描述统计,利用数字或者图表的方法,寻找数据集的规律,总结其中的信息,并以恰当的方法展现这些信息。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
  我的理解:根据样本数据本身的内容进行统计分析的,描述的是样本客观的一些规律、信息等。比如,从一堆苹果中随机挑选出部分东西,挑选出来的部分是圆的、红色的、平均重100g等这些数据就是统计分析。
  
  推断统计,利用样本数据的信息,对总体的情况做出估计、推断、预测或其他归纳。推断统计是研究如何利用样本数据来推断总体特征的统计方法。包含两个内容:参数估计,即利用样本信息推断总体特征;假设检验,即利用样本信息判断对总体的假设是否成立。
  我的理解:根据样本的数据,推断、估计、预测出总体的情况。比如,从一堆苹果中随机挑选出部分东西,挑选出来的部分是圆的、红色的、平均重100g等,根据这些数据猜测那一堆苹果都是圆的、红色的、平均重100g,得出的结论是推断统计。
  
  推断统计之所以出现,是因为没有办法知道总体的数据,如果能够知道所有的数据,那么估计只需要描述统计就可以了,如果这样统计学也就不存在了,统计的核心问题就是:抽样 。
  这里写图片描述
  
  
  数据的类型分为:定量数据(数值)和定性数据(分类)。

  数据的收集的方法:
     - 观察,也就是自己观察记录,自己动手丰衣足食
     - 公开发表的资料,去一些公开的网站,比如统计年鉴、数据堂等网站下载资料
     - 调查,发问卷
     - 设计实验,获得一些实验数据
     - 利用互联网,通过爬虫可以爬取到很多很有用的数据

  非随机样本的问题:
    1、选择偏差
    2、无应答偏差
    3、测量误差
  关于这个问题,有一本书《统计学会撒谎》,这本书中有一些很有趣的小例子生动形象的描述了使用统计学歪曲事实,前面有几章讲解的就是非随机样本的问题,利用非随机样本会产生误差进行扭曲事实。

参考资料:
《麦克拉夫商务与经济统计学》
    

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值