
定量分析
文章平均质量分 78
旋转跳跃我闭着眼
985本科,管理科学与工程博士在读,对ML,DL,RL很感兴趣,数据挖掘,数据交叉学科,因果推断,实证研究,前端开发都涉及一点,有时候也会更新一些研究方法,比如定性分析,定量分析,或者论文解读又或者是一些科技吃瓜文。
时间掰碎,多学多看,没事总结总结基础知识和这些年学到的东西,希望博客能通俗易懂,从基础开始,不要嫌弃基础太简单,要多注意细节!
展开
-
【定量分析、量化金融与统计学】纵向数据分析(1)——截面数据、时间序列数据和纵向数据
一、截面数据(Cross-sectional Data)截面数据就是固定时间来分析其他变量同一时间内的关系。例如:比较2022年的全国20个省市的GDP与人口,那么我们就是限定了2022年,去找GDP和人口的可能关系。再例如:美国枪械协会调查15岁儿童的性别,家庭背景,收入,受教育程度和持枪犯罪的关系。那么这个15岁也是限定了时间。所以截面数据探讨:在一个组织中,影响薪酬的因素包括年龄、教育程度、经验、职位、性别、团队规模和业绩 指对某一特定时间点上的总体或代表性子集的观察二、时间序原创 2022-05-04 09:30:30 · 9862 阅读 · 1 评论 -
【定量分析、量化金融与统计学】R语言:多元线性回归实例
今天来做一个R语言的多元线性回归的实例:原创 2022-04-12 11:15:07 · 5758 阅读 · 0 评论 -
【定量分析、量化金融与统计学】R语言:哑变量与多重共线性
我们对多重共线性做了简单解释,今天用程序来做一下多重共线性的检验。原创 2022-04-11 17:32:45 · 1007 阅读 · 0 评论 -
【定量分析、量化金融与统计学】统计推断基础 番外(3)---假设检验例题讲解
一、前言本节复习假设检验,所用到的表格和基础知识均已经讲过,所以本篇是单纯的练习,也是提供一些练手的试题给大家。不讲原理。二、例题原创 2022-04-11 16:08:09 · 474 阅读 · 0 评论 -
【定量分析、量化金融与统计学】逻辑回归Logistic----分类回归
我们上一讲说了什么是分类变量,而且我们举的例子都是自变量是分类变量,那么如果因变量是分类变量我们应该怎么做回归呢?常规的线性回归肯定是不行的,因为因变量是分类变量,所以这并不能够成连续的回归结果,那么就有人研究出了一种专门为分类因变量定制的回归模型,逻辑回归,所以逻辑回归回归的是什么?是逻辑,不是值,所谓的逻辑就是分类,这也是为什么逻辑回归会在机器学习中被当做分类算法的原因,逻辑回归是和值回归(线性回归,非线性回归)不相同的回归方法。原创 2022-04-11 14:39:59 · 1609 阅读 · 0 评论 -
【定量分析、量化金融与统计学】分类变量与多元非线性关系与子集的选择
那么这一节来说一种特殊的自变量----分类变量,以及简单介绍什么是多元非线性关系。原创 2022-04-11 10:57:35 · 3829 阅读 · 0 评论 -
【定量分析、量化金融与统计学】多元回归模型与回归推理
之前说过了一元线性回归并给出了程序,今天来说说多元回归模型(Multiple Regression Model)原创 2022-04-11 10:21:48 · 1478 阅读 · 0 评论 -
【定量分析、量化金融与统计学】统计推断基础 番外(2)---区间估计的例题讲解
一、前言在前几次的文章中我们说了什么是区间估计,今天我们来做一下例题讲解。区间估计的题相对简单。我们分析四道题来完整我们的流程。所有的基础知识都在之前的博客中,这个只是练习,不讲原理。二、例题讲解1.社区超市100名购物者的总购物账单的均值为50美元,标准差为12.50美元。总体均值的估计值是多少?这个估计的合理误差范围是什么?n = 100样本均值为50,DV = 12.5此时求SE = DV/√n = 12.5/10 = 1.25我们默认为95%置信区间估计范围是原创 2022-04-10 14:11:19 · 1363 阅读 · 0 评论 -
【定量分析、量化金融与统计学】统计推断基础 番外(1)---T table与Z table的值
目录一、前言二、T-table三、Z-table一、前言为了方便之后的例题讲解,这里放上T-tabel和Z-table的值。怎么查表,本篇中会直接讲,所以这里就只看表格就行,本篇为工具篇。二、T-table我们给两个版本:适合用哪个就用那个:表一:表二:三、Z-table四、如何使用T-table和Z-table你可以使用Z-score表,使用Z-score公式找到各种z值的“小于”概率的完整集合。上面是正z分数和负z分数表格.原创 2022-04-10 13:45:19 · 9672 阅读 · 0 评论 -
【定量分析、量化金融与统计学】统计推断基础(5)---一类错误与二类错误
这是这个系列的最后一篇,我们讲一讲什么事一类错误,什么事二类错误。这个系列统计推断基础5部分分别是:总体、样本、标准差、标准误【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误样本均值分布、中心极限定理、正态分布【定量分析、量化金融与统计学】统计推断基础(2)---样本均值分布、中心极限定理、正态分布点估计、区间估计【定量分析、量化金融与统计学】统计推断基础(3)---点估计、区间估计假设检验【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z原创 2022-04-09 18:26:13 · 4957 阅读 · 0 评论 -
【定量分析、量化金融与统计学】统计推断基础(4)---假设检验(T或者Z检验)
目录一、前言二、假设检验的基本概念1.假设检验的概念与目的:2.原假设三、假设检验的实例步骤:例子:一个问题:四、不同种类的假设检验:one-sample T检验:Two-sample T检验:(1)Matched Pairs 匹配成对检测(2)Unmatched PairsOne-tail 测试(单侧检验):two-tail检测(双侧检验)一、前言这一节来说一说假设检验,这是一个在统计学,量化领域很重要的一个概念。那么《统计推断基础》这.原创 2022-04-09 18:05:45 · 1834 阅读 · 0 评论 -
【定量分析、量化金融与统计学】统计推断基础(3)---点估计、区间估计
我发现很多人学了很久的统计学,仍然搞不清楚什么是点估计、区间估计,总是概念混淆,那今天我们来盘一盘统计推断基础的点估计、区间估计。这个系列统计推断基础5部分分别是:总体、样本、标准差、标准误【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误样本均值分布、中心极限定理、正态分布【定量分析、量化金融与统计学】统计推断基础(2)---样本均值分布、中心极限定理、正态分布点估计、区间估计I型误差,II型误差假设检验重点在基础概念,基础不牢,地动山摇,不关你是做研究还是原创 2022-04-09 14:41:10 · 2864 阅读 · 1 评论 -
【定量分析、量化金融与统计学】统计推断基础(2)---样本均值分布、中心极限定理、正态分布
我发现很多人学了很久的统计学,很多总是概念混淆,那今天我们来盘一盘统计推断基础的三个基本概念:样本均值分布、中心极限定理、正态分布。这个系列统计推断基础5部分分别是:总体、样本、标准差、标准误 :【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误 样本均值分布、中心极限定理、正态分布点估计、区间估计I型误差,II型误差假设检验重点在基础概念,基础不牢,地动山摇,不关你是做研究还是本科基础学习阶段,基础都是很重要的。大数定理与中心极限定理有什么原创 2022-04-09 13:52:50 · 1495 阅读 · 1 评论 -
【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误
我发现很多人学了很久的统计学,仍然搞不清楚什么事标准差,标准误,什么是样本,什么是总体,总是概念混淆,那今天我们来盘一盘统计推断基础的四个基本概念:总体,样本,标准差,标准误。这个系列统计推断基础5部分分别是:总体、样本、标准差、标准误样本均值分布、中心极限定理、正态分布点估计、区间估计I型误差,II型误差假设检验重点在基础概念,基础不牢,地动山摇,不关你是做研究还是本科基础学习阶段,基础都是很重要的。我尽量使用语言来描述这些概念,少量使用数学公原创 2022-04-09 10:54:07 · 2644 阅读 · 0 评论 -
【定量分析、量化金融与统计学】R语言方差分析的outliers陷阱
【定量分析、量化金融与统计学】R语言方差分析的outliers陷阱原创 2022-04-06 17:12:35 · 1085 阅读 · 0 评论 -
【定量分析、量化金融与统计学】各种检验的H0假设与p-value究竟是什么含义
可能刚接触量化分析的人都会对各种检验感觉到懵,这个检验究竟检验什么?p值小于0.05,究竟拒绝了什么假设?是什么意思?我刚学的时候也有这样的疑问,今天就盘一盘各种假设究竟在说什么!原创 2022-04-06 15:31:01 · 6654 阅读 · 0 评论 -
【定量分析、量化金融与统计学】R语言线性回归(2):一元线性回归实例
一、前言上次说了基本理论,今天说说例子:我们用的数据集是啤酒的每周销量数据集:二、逐步讲解r语言程序1.导入数据集并查看数据集的基本情况x=read.csv(file.choose(), header=TRUE)names(x)summary(x)结果:2.查看数据分布情况plot(x$Week,x$PRICE.18PK,xlab="Week",ylab="Price.18PK")lines(x$PRICE.18PK)结果:3.查看自...原创 2022-04-05 17:07:21 · 3750 阅读 · 4 评论 -
【定量分析、量化金融与统计学】R语言线性回归(1):一元线性回归(理论篇)
一、前言我们在讲过ANOVA,MANOVA,今天来说一下线性回归,本篇只做理论,R语言代码会在下一篇讲解。一元线性回归在统计学,计量经济学和机器学习中很常见,我们今天来走一遍一元线性回归的流程。二、变量的关系变量的关系包括很多种,首先是确定性关系:例如:圆的面积S与半径r第二种是依赖型关系:例如:农作物产量与气温,降水,干湿度的关系,你并不能找到一个完美的模型来模拟或者预测这几者的关系。但是,要注意,依赖型关系不一定是因果性的,例如:天热了,冰激凌销量上升,同时溺水的人也增多了,你发原创 2022-04-05 16:30:55 · 2212 阅读 · 0 评论 -
【定量分析、量化金融与统计学】R语言MANOVA多元方差分析
一、前言之前说过了ANOVA,包括one-way和two-way,虽然没说详细过程,但是建立了一个使用R语言进行ANOVA分析的步骤。今天来进一步说一说MANOVA,那么MANOVA是多元方差分析,注意,这个元字指的是因变量,也就是Dependent Var。所以多元方差分析,是多个因变量的方差分析,但是,two-way ANOVA是只有一个因变量,但是多个自变量,注意区别。另外,MANOVA也分one-way与two-way。MANOVA感觉国内讲的很少,我贴一个国外小哥讲的视频非常的清晰。M原创 2022-04-05 08:58:57 · 4869 阅读 · 0 评论 -
【定量分析、量化金融与统计学】R语言ANOVA方差分析关于outliers(异常值)的处理
这是一个短篇,主要用于补充上一篇ANOVA假设检验的问题。在ANOVA中,假设检验不仅仅要包括上一篇中所说的那三类。还会有异常值检验,就是所说的outliers。我们可以看一下boxplot中的异常值:这些地方在正态检验的时候是存在异常值的,那么我们为了数据的健康,这些异常值必须要拿掉,那么我们用R语言走一遍流程。outliersx6<-boxplot(x6 ~ x1, data = x, xlab = "customer type"...原创 2022-04-04 19:35:23 · 1132 阅读 · 0 评论 -
【定量分析、量化金融与统计学】R语言方差分析ANOVA(F检验)
今天来说一说概率论或者统计学中常用的一种检验方式,方差检验ANOVA.根据定义:方差分析(ANOVA)是一组统计模型及其相关估计程序的集合。原创 2022-04-04 19:12:54 · 6749 阅读 · 1 评论