
数据分析
文章平均质量分 63
数据分析经验积累
欧拉n哥
英国精算师协会 IFoA 2016年度 Brian Hey 获奖者
展开
-
Python 做怀特异方差一致稳健标准误估计
本文介绍用 python 做怀特异方差一致稳健标准误估计的方法。原创 2024-05-05 20:15:00 · 876 阅读 · 0 评论 -
用Python做多项Logit模型
看到网上有一些用 python 做多项 Logit 模型的讲解,大多是使用 scikit-learn 库。这里要介绍的是如何使用 statsmodels 库来做多项 Logit 模型。原创 2024-05-04 21:30:40 · 1194 阅读 · 0 评论 -
谈谈 Python 中的 McNemar 检验(一)
McNemar检验,最常用的用法是用来检验列联表的相似性,但实际上它也可以用来检验两个相关样本是否来自同一分布。原创 2024-03-27 21:47:02 · 780 阅读 · 0 评论 -
谈谈 Python 中的 McNemar 检验(二)
前一篇文章说了McNemar检验,除了最常用的用法是用来检验列联表的相似性之外,它还可以用来检验两个相关样本是否来自同一分布。原创 2024-03-27 22:13:17 · 747 阅读 · 0 评论 -
谈谈 Python 中的 McNemar 检验(三)
这一篇主要说一说 McNemar 的具体算法。原创 2024-03-27 22:43:01 · 403 阅读 · 0 评论 -
联立方程模型的可识别性的通俗解释
这意味着,我们只能用一个方程 Y=2+3*X 来求解Y,如果又给我们一个方程说 Y=4+5*X,这时就意味着,我们无法通过 X 求出 Y 了,因为两个方程矛盾(注意,你可能会问,两个方程不是正好将X和Y两个变量求出来吗?换句话说,当我们面对 C=-2+3*Y 和 C=4+5*Y+6*C(t-1) 两个方程时,是根本就不出来 C 的,因为两个方程是矛盾的,因为 Y 和 C(t-1) 都是“会变的已知数”,而且两者都是自由改变,不存在Y受到C(t-1)制约的情况(也就是二者不存在线性相关性)。原创 2024-03-09 10:15:00 · 1140 阅读 · 0 评论 -
踩过的Python中分布拟合包fitter的一个天坑
如果你按照这段代码跑,放心,妥妥地只看到 “ Process finished with exit code 0”这篇文章的尾部也注明了,内容上参考了pypi org上的fitter说明。但是,不得不让我骂一句街 MaDe,pypi上面写的真TMD不负责。说实话,必须要给写文档的哥们一个差评 : (经本人尝试,还需要在最后加上一句代码。原创 2024-03-09 09:15:00 · 499 阅读 · 1 评论 -
产险精算GLM-GAM案例
但是,实践中要慎用 GAM,因为从上面的例子可以看到,GAM由于样条函数的存在,使其可解释性不如GLM好,而且 配置高 的 GAM 也很容易出现 过拟合 的现象,对 数据训练集 拟合程度很好,但未必适用于 数据测试集。因此,从模型应用的角度,选择 低配版的GAM 可能就可以了。这里,我们对 Claims 做拟合,因为如果对Freq做拟合的话,由于因变量 AOI 和 Terr 都是分类变量,则无法使用 GAM 做拟合了。广义线性模型GLM的升级是广义加法模型GAM,而 GLM 只是 GAM 的一个特例。原创 2023-08-04 20:45:00 · 452 阅读 · 0 评论 -
Python下的Logistic回归模型
今天也写写专业文章,Logistic回归模型原创 2022-12-07 15:25:10 · 2535 阅读 · 1 评论 -
主成分分析/因子分析与线性映射
数据降维,包括主成分分析PCA和因子分析FA,都离不开特征值和特征向量。今天先不细说特征值和特征向量,先说一说理解数据降维的一个关键概念,线性映射。原创 2022-12-07 20:02:40 · 424 阅读 · 0 评论 -
通俗地讲讲数据降维的原理
什么是数据降维?关于这个问题,很多专家的说法都非常学术,估计很多普通人听不懂。所以,这里用通俗的语言解释一下,希望有助于更多的入门新人理解。原创 2022-12-07 20:16:55 · 887 阅读 · 0 评论 -
也谈特征值和特征向量的几何意义
今天我也从一个保险精算师的角度,谈谈特征值和特征向量的几何解释,希望我的解释,能让更多的新人理解。原创 2022-12-14 19:29:26 · 861 阅读 · 0 评论 -
【新闻】李晓翾先生荣获北美产险精算学会2022年度卓越成就奖
北美产险精算学会(CAS)于2022年10月初在官网宣布了北美产险精算学会的年度评奖结果。原创 2022-12-20 19:55:12 · 421 阅读 · 0 评论 -
谈主成分分析/因子分析中的特征值“矩阵近似”
优快云中一些文章在介绍这个问题或者叫“特征值分解”时,讲得都比较学术化,今天用一个小例子,还是面向新人,来引导理解“特征值分解”和“矩阵近似”。原创 2022-12-20 22:01:59 · 1650 阅读 · 2 评论 -
产险精算GLM案例
这是对北美产险精算学会CAS北美产险精算师考试教材《广义线性模型实践者指南》的第一章中的实例的一个结果验证。原创 2022-12-23 18:30:00 · 708 阅读 · 1 评论 -
产险精算GLM案例2
这是北美产险精算学会CAS网站上的一个案例,对案例略作修改后进行验证。原创 2022-12-24 20:22:59 · 707 阅读 · 0 评论