- 博客(16)
- 收藏
- 关注
原创 计算稀疏矩阵和稀疏向量的中心化余弦相似度(centered cosine sim for sparse matrices and sparse vectors)
使用稀疏矩阵进行协同过滤算法,从而节省存储空间,提高计算效率。
2024-12-16 03:00:09
302
原创 推荐系统 recommender system - CF(collaborative filtering协同过滤)
对于推荐系统中协同过滤算法的简单介绍和代码实现。
2024-12-13 07:51:39
444
原创 两秒掌握git
在当前目录下新建文件first-git,进入文件,运行git init,则将first-git变成了一个git可以管理的仓库。相应的,git中的文件也存在四种状态,即未跟踪untrack(新创建的文件),未修改unmodified(已经提交到git仓库,且没有发生修改的文件),已修改modified,和已暂存staged。也可以在.gitignore文件中使用通配符,以忽略一类文件。随后,编写一个文件,并通过git add命令提交到暂存区,并通过git commit命令将暂存区中的文件提交到git仓库中。
2024-11-02 06:52:06
870
原创 抽样技术笔记
1. 调查的基本概念1.1 普查是为了某个特定目的专门组织的全面调查。1.2 抽样调查是一种非全面调查,按照一定程序从总体中抽选一部分单位进行调查或者观察,对总体参数作出推断的调查方式。有可能获得比普查质量更高的数据质量。抽样调查又可分为概率抽样和非概率抽样。1.2.1 概率抽样即随机抽样,按照概率原则,根据“单元是否按照一定的概率入样”划分,总体中每个单位都有一定的概率被选入样本,使得样本对总体具有充分代表性,避免人为因素干扰。1.2.2 非概率抽样即非随机抽样,以
2022-04-12 02:13:22
2430
原创 时间序列分析
1. 简介1.1 时间序列定义(1) 随机序列:按时间顺序排列的一组随机变量(2) 观察值序列:随机序列的n个有序观察值,序列长度为n。1.2 时间序列分析方法1.2.1 描述分析法1.2.2 确定性因素分解方法认为所有序列波动均可归纳为受到四个因素的影响:即长期趋势,循环波动,季节性变化,随机波动。1.2.3 随机性因素分解方法也称频域分析方法,谱分析法。1.2.4 时域分析方法从序列自相关角度揭示时间序列发展规律。(1) 定理a. Wold分解定理
2022-01-05 20:10:34
9450
原创 计量经济学笔记
1. 绪论数据类型模型检验2. 双变量线性回归模型最小二乘法 OLS极大似然估计模型的统计检验方程显著性检验变量显著性检验总体参数的置信区间预测3.多元线性回归模型非线性处理虚拟变量4.模型存在的问题和解决办法异方差模型误设定自相关多重线性5.联立方程模型内生变量、外生变量可识别方程参数估计方法 2SLS、ISL、3SLS
2022-01-01 20:12:39
6440
1
原创 PLS-PM with R 偏最小二乘路径建模 (R语言)
1. 引入1.1. 安装plspm包plspm 是一个用于执行偏最小二乘路径建模分析的 r 程序包。在 CRAN 上可以免费下载: Http://cran.r-project.org/web/packages/plspm/index.html.此后,通过以下代码在r中安装并加载该程序包即可。install.packages("plspm")library("plspm")2. 一些简单概念2.1. 潜变量和观测变量不少变量如满意度、成功指数是无法通过观测得到
2021-12-24 12:59:41
10473
1
原创 离散数学笔记
1. 命题逻辑2. 一阶逻辑3. 集合论3.1 集合代数3.2 二元关系3.3 函数4. 图论4.1 图的基本概念4.2 通路和回路4.3 图的矩阵表示4.4 欧拉图&哈密顿图5. 树5.1 无向树5.2 生成树
2021-12-09 20:18:23
12155
1
原创 应用多元统计分析
目录1. 多元正态分布&参数估计2. 多元正态总体参数的假设检验3. 回归分析4. 判别分析5. 聚类分析6. 主成分分析7. 因子分析8. 对应分析方法9. 典型相关分析10. 偏最小二乘回归分析1. 多元正态分布&参数估计1.1. 随即向量基本概念随机向量:多元统计讨论的是多变量总体,即将p个随机变量放在一起形成的p维随机向量X=(X1,X2,...,Xp).样品:对p个变量做一次观测得到观测值(x1,x2,...,xp
2021-12-08 17:35:12
6899
1
原创 非平稳时间序列确定性分析
趋势分析1. 趋势拟合法1.1 线性拟合(长期趋势呈现出线性形式)可以用最小二乘估计1.2 非线性拟合(长期趋势呈现出非线性形式)可以转换成线性模型的用最小二乘估计,不能的用迭代法2. 平滑法2.1 移动平均法可以有效消除季节性影响and简单提取出(非)线性趋势。假定:在较短的时间间隔里,序列值之间的差异主要源自随机波动。因此可以用一定时间间隔内的均值作为某一期序列值的估计2.1.1 n期中心移动平均如 2.1.2 n期移动平均如 2.1.3
2021-12-04 01:23:22
752
原创 多元回归中的交互项
当某个解释变量会影响另外一个解释变量对响应变量的影响途径时,我们需要做出调整,在模型中增加一个交互项,可以是两个解释变量的乘积。例子:如回归模型: 由于female(性别)影响着married(婚姻情况)对wage(工资)的影响途径,故可以增加一个解释变量 female*married将回归模型调整为: ...
2021-11-23 10:46:01
9543
原创 通过R语言实现平稳时间序列的建模--基础(ARMA模型)
目录1. 建模流程2. 序列平稳性检验和纯随机性检验2.1 图检验2.2 单位根检验3. 模型选择4. 参数估计5. 模型检验5.1 模型显著性检验5.2 参数显著性检验6. 模型优化6.1 AIC准则6.2 BIC准则7. 预测1. 建模流程1.1 序列平稳性检验+纯随机性检验1.2 模型选择1.3 参数估计1.4 模型检验1.5 模型优化1.6 预测2. 序列平稳性检验和纯随机性检验2.1 图检验主要适用.
2021-11-19 20:20:37
26001
22
原创 模型建立和估计中的问题及对策
由于估计多元线性回归参数所使用的OLS法建立在一系列基本假设下,而在实践中,这些假设难以被全部满足,因此在这类情况下,我们就需要改变分析方法。
2021-11-16 22:45:04
4935
原创 Eviews软件工具——线性回归模型(超详细版本)
简单线性回归模型打开Eviews软件,可以选择建立一个new workfile,也可以选择打开一个已存在的workfile。选择数据类型:Unstructured/Undated 横截面数据Dated-regular freguency 时间序列数据(有固定的频率,默认为年度数据)Balanced Panel本次实验样本为时间序列数据,因此在Workfile structure type一栏选定Dated-rugular frequency。此后可以在Frequ...
2021-11-06 19:49:41
30208
5
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人