
知识分享
文章平均质量分 90
蓝皮怪
普通双非毕业生,应用统计学专业,在校期间,获得了多项省级和全国竞赛的奖项,包括第十二届全国大学生数学竞赛省级二等奖、正大杯第十一届全国大学生市场调查与分析大赛省级三等奖,以及2021年全国大学生数学建模竞赛云南赛区本科组三等奖、首届云南省大学生市场调查与分析大赛本科组一等奖、第八届全国大学生统计建模大赛云南赛区选拔赛本科组一等奖;目前,我已经在社区发布了30多个项目,和鲸主页:https://www.heywhale.com/home/user/profile/620b264cc1ae5e00174705fa/overview,公众号:蓝皮怪的数据坊。
展开
-
关于《关卡2:Pandas采样》学习心得分享
本人参加和鲸社区的《时间序列数据处理训练营》并且结合gpt来学习时间序列,补充了一些内容,希望能够帮助大家学习时间序列,这是第二节内容。原创 2025-01-16 20:14:27 · 876 阅读 · 0 评论 -
关于《关卡1:Pandas处理时间数据》学习心得分享
本人参加和鲸社区的《时间序列数据处理训练营》并且结合gpt来学习时间序列,补充了一些内容,希望能够帮助大家学习时间序列,这是第一节内容。原创 2025-01-16 20:14:20 · 1134 阅读 · 0 评论 -
数据分析新技能:如何进行Mann-Whitney U检验
Mann-Whitney U检验是一种强大的非参数统计方法,适用于比较两个独立样本的分布,特别是当数据不满足正态分布或存在异常值时。本文详细介绍了Mann-Whitney U检验的起源、原理和操作步骤,并通过一个具体的案例展示其实际应用。原创 2024-05-22 09:39:29 · 6800 阅读 · 0 评论 -
方差分析速成指南:让你的数据分析更上一层楼
你是否想要揭示多个组之间的显著差异,却不知道从哪里开始?方差分析(ANOVA)就是你的秘密武器!本文将带你深入了解方差分析的起源、原理和具体操作步骤。通过一个简单易懂的案例分析,你将学会如何运用方差分析评估不同处理对实验结果的影响。我们还提供了Python和R代码示例,帮助你快速上手实践。无论你是数据分析的新手,还是需要提升技能的专业人士,这篇文章都能让你掌握方差分析的精髓,让你的数据分析更具说服力。赶快阅读,揭开数据背后的秘密吧!原创 2024-05-19 10:16:32 · 1132 阅读 · 1 评论 -
新手也能轻松上手!8步学会数据分析,附Python和R代码示例
数据分析是现代社会中不可或缺的技能,不论你是学生、研究人员还是企业员工,掌握数据分析技巧能帮助你更好地理解和利用数据,做出更明智的决策。本文详细介绍了新手进行数据分析的八个关键步骤,从确定分析目标、数据收集、数据清洗到数据探索与可视化、统计检验、数据建模、结果解释与报告、实施与优化,并提供了Python和R的代码示例,帮助你一步步轻松上手数据分析。原创 2024-05-18 11:13:00 · 778 阅读 · 0 评论 -
探究影响因素的常用方法之一——t检验
本文介绍了t检验(t-Test),一种用于比较两个组之间均值差异的统计方法。文章首先讲述了t检验的起源和基本原理,接着详细阐述了计算t统计量的步骤。通过一个具体的案例分析,展示了t检验的实际应用,并提供了Python和R的代码示例。文章还讨论了使用t检验时的注意事项,并总结了其在心理学、医学、经济学等领域的广泛应用。t检验通过比较两个样本的均值,帮助研究者评估不同处理方法、条件或群体之间的差异,为科学研究和决策提供有力支持。原创 2024-05-17 14:07:37 · 1142 阅读 · 0 评论 -
探究影响因素的常用方法之一——卡方检验
本文介绍了卡方检验(Chi-Square Test),一种用于检验分类变量之间关联关系的统计方法。文章首先阐述了卡方检验的起源和基本原理,接着详细说明了计算卡方统计量的步骤。通过一个具体的案例分析,展示了卡方检验的实际应用,并提供了Python和R的代码示例。文章还讨论了使用卡方检验时的注意事项,并总结了其在社会科学、医学和其他领域的广泛应用。卡方检验通过分析分类变量之间的独立性和差异性,为研究提供了重要的统计支持。原创 2024-05-16 13:58:35 · 1701 阅读 · 0 评论 -
相关性分析——点二列相关分析
点二列相关分析是一种灵活且有效的统计方法,特别适用于评估二元变量与连续变量之间的关系。通过对这两种变量之间关系的分析,可以帮助研究者更好地理解数据,为教育学、心理学和社会科学等领域的研究和决策提供有力支持。原创 2024-05-16 13:34:09 · 5603 阅读 · 0 评论 -
相关性分析——皮尔逊相关性分析
皮尔逊相关系数通过计算两个变量的协方差和标准差来量化它们之间的线性关系。其值在-1到1之间,1表示完全正相关,-1表示完全负相关,0表示没有线性关系。r∑Xi−X‾Yi−Y‾∑Xi−X‾2∑Yi−Y‾2r∑Xi−X2∑Yi−Y2∑Xi−XYi−Yr( rr):皮尔逊相关系数,反映两个变量之间的线性相关程度。Xi( X_iXi):变量X的第i个数据点。Yi( Y_iY。原创 2024-05-15 15:41:56 · 2301 阅读 · 0 评论 -
相关性分析——斯皮尔曼相关性分析
斯皮尔曼相关性分析是一种灵活且有效的统计方法,特别适用于非正态分布或存在异常值的数据。通过对排名的分析,它能有效揭示变量间的相关关系,为研究和决策提供有力支持。原创 2024-05-14 20:37:46 · 7438 阅读 · 1 评论 -
处理样本不平衡的方法——SMOTE算法
在数据科学领域,数据集的类不平衡是一个常见的问题,特别是在分类任务中。为了解决这个问题,Nitesh Chawla等人在2002年提出了SMOTE旨在通过合成少数类样本来提升模型对少数类的识别能力。这篇文章将详细介绍SMOTE的工作原理、应用、优缺点,以及在Python和R中的具体实现。原创 2024-05-13 11:31:09 · 715 阅读 · 0 评论 -
相关性分析——肯德尔相关性分析
本文介绍了肯德尔相关性分析(Kendall's Tau),一种用于衡量两个变量之间排序一致性的非参数统计方法。原创 2024-05-15 12:10:26 · 1772 阅读 · 0 评论