统计学相关问题解答与分析
在数据分析和统计领域,人们常常会遇到各种各样的问题。下面将对一些常见问题进行详细解答和分析。
大数据中小 p 值的替代方案
在大数据中,小 p 值可能大量存在,那么对于拥有数百万样本的数据,是否有可替代 p 值的方法呢?
Christopher - Louden 认为,严格意义上没有替代方案,而是应该考虑其他衡量指标。这些指标取决于所解决的问题类型。一般来说,当出现小 p 值时,还应考虑效应大小的幅度。因为有时即使统计上高度显著,但在实际中可能并无意义。同时,报告效应大小的置信区间也很有帮助。
Alex - I 指出,当有很多变量可以进行两两相关性测试时,可以使用错误发现率(FDR)或族系误差率(FWER)的校正方法。例如,可以使用 Holm - Bonferroni 方法。对于大样本而非大量变量的情况,可以结合效应大小的置信区间,并对置信区间的 p 值应用错误发现率校正。为了使结果更准确,建议使用非参数方法来估计置信区间,比如使用自举法(bootstrapping)。
社会科学家从事数据科学的可行性
一位学习政治学且专注于统计学的人,想成为数据科学家,但缺乏机器学习、SQL 和 Hadoop 方面的知识,同时几乎所有招聘都要求信息学、物理学等技术领域的学位,那么其目标是否可行呢?
Steve - Kallestad 认为,数据科学这个术语使用很宽泛,不同公司的数据科学家职责差异很大。不必过于追求职位名称,如果对该领域感兴趣,可以通过社交网络寻找合适的机会。在浏览招聘广告时,关注强调统计学和信息学背景的职位。Hadoop 和 SQL 只要有时间和动力,很容易掌握,应从自己
超级会员免费看
订阅专栏 解锁全文
6980

被折叠的 条评论
为什么被折叠?



