自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Python领域优质萌新学习笔记

技术小白的自我修养

  • 博客(569)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 一文搞懂:如何在深度学习中使用GPU和cuda加速

接下来,我们使用 x.tolist() 方法将 x 转换为Python列表并将其添加到 result 中,或者使用 x.cpu().numpy() 方法将 x 转换为CPU上的NumPy数组,然后将该数组添加到 result 中。不是的,len(Xdata)并不在GPU上。要在GPU上创建一个列表,并将张量对象添加到该列表中,可以使用PyTorch的torch.Tensor.tolist()方法或者torch.Tensor.cpu().numpy()方法先将张量转换为NumPy数组,再将数组添加到列表中。

2023-12-02 10:17:42 9775 2

原创 菜鸟学Java public static void main(String[] args) 是什么意思?

包名的层数没有硬性的限制要求,你可以根据需要组织包的层次结构。一般来说,官方网站或文档会提供相应的版本兼容性信息,你可以参考这些信息选择适合你的项目的版本。而对于第三方库和框架包,你需要下载相应的库文件,并在项目中进行配置和引用,以便使用其功能。方法中使用其他类型的参数,你可以将命令行传入的字符串参数解析为你需要的类型。),包含了方法要执行的代码块。在这个例子中,方法体内部没有给出具体的代码,你可以在这个代码块中添加你要执行的操作。对于包的层数并没有硬性的限制要求,你可以根据自己的需要来组织包的层次结构。

2023-06-25 17:16:31 31238 7

原创 联邦学习算法介绍-FedAvg详细案例-Python代码获取

在DP-FedSGD中,被选中的参与方使用全局模型参数对局部模型进行初始化,通过批梯度下降法进行多轮梯度下降,计算梯度更新量。而在DP-FedAVG中,是利用一个批次的数据进行一次梯度下降,计算梯度更新量。由服务端收集各客户端的梯度信息,通过聚合计算后再分发给各客户端,从而实现多个客户端联合训练模型,且“原始数据不出岛”,从而保护了客户端数据隐私。假设中心方是好奇的,那么客户端通过某种规则向其他客户端广播梯度信息,收到梯度信息的客户端聚合参数并训练,将新的梯度信息广播。面向神经网络模型, 假设网络总共有。

2023-03-12 10:36:34 27610 200

原创 MySQL 案例-教学管理信息系统

MySQL简单案例,通过构建数据库、建立表格,以及约束。向表格中插入值等操作。

2023-03-11 20:04:16 8485 4

原创 知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

你好!这是一款实体关系联合标注的本地小程序,以Python3Python3Python3实现。本系统是一种标注文本语料中命名实体与关系或属性的半自动化软件系统,应用PythonPythonPython编程实现可视化界面和主要功能,利用HTMLHTMLHTML和CSSCSSCSS提示标注教程与规范(无需关心它们如何实现)。利用本系统进行文本标注将原始段落文本更新为带有事先定义的命名实体、关系或属性的文本标签数据。

2022-10-31 15:44:50 9156 103

原创 python爬虫技术实例详解及数据可视化库

前言在当前数据爆发的时代,数据分析行业势头强劲,越来越多的人涉足数据分析领域。面对大量数据,人工获取信息的成本高、耗时长、效率低,是否能用代码去完成大量复杂的工作,从而从网络上获取到目标信息?由此,网络爬虫技术应运而生。网络爬虫简介网络爬虫(web crawler,又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种用来自动浏览万维网的程序或者脚本。爬虫可以验证...

2020-02-24 11:58:56 8089 8

原创 【概念初识】什么是因果推断?

摘要:本文深入探讨了相关分析与因果推断的核心差异。相关分析(如相关系数)仅描述变量间的统计关联,而因果推断(如随机对照试验)旨在确定变量间的因果关系。通过经典案例(冰淇淋销量与溺水人数的虚假相关)揭示混淆变量的影响,并对比了两种方法的适用范围与局限性。文章强调“相关性不等于因果性”,并介绍因果推断的关键方法(如工具变量、断点回归等),指出回归分析可作为工具但需满足严格假设才能用于因果推断。最后以教育回报、药物试验等案例,说明如何在统计实践中实现从相关到因果的跨越。全文系统阐述了因果推断的理论框架与实践路径,

2025-10-10 10:46:57 861

原创 论文《Inference for Iterated GMM Under Misspecification》的例子3

例子3展示了在非线性矩条件下,迭代GMM的收敛性依赖于误设程度。只有当方差误设较小(σ223σ22/3) 时,迭代才保证收敛。否则,可能需要使用稳健推断方法。

2025-09-26 21:02:02 903

原创 论文《Inference for Iterated GMM Under Misspecification》的例子2

在论文《Inference for Iterated GMM Under Misspecification》的例子2中,作者通过一个线性工具变量(IV)模型展示了在模型误设(misspecification)下迭代GMM估计量的行为。该例子旨在说明,即使工具变量无效(违反排除限制),迭代GMM估计量仍能通过收缩映射收敛到一个伪真实参数(pseudo-true parameter),且该固定点对误设程度不敏感。

2025-09-26 20:02:28 716

原创 《Inference for Iterated GMM Under Misspecification》的例子1

在论文《Inference for Iterated GMM Under Misspecification》的例子1中,位置模型用于演示在模型误设(misspecification)下迭代GMM估计量的行为。该例子考虑一个简单的位置模型,其中观测值 Xi=(Yi,Zi)X_i = (Y_i, Z_i)Xi​=(Yi​,Zi​) 是独立同分布的(i.i.d.)。矩函数定义为 m(Xi,θ)=(Yi−θ,Zi−θ)′m(X_i, \theta) = (Y_i - \theta, Z_i - \theta)'m(

2025-09-26 17:29:25 1082

原创 广义矩估计错误指定时的一个推导【续7】

正文中的描述:定理3。设θ^T(2){\widehat{\theta }}_{T}\left( 2\right)θT​(2)为基于WT=V^T−1{W}_{T} = {\widehat{V}}_{T}^{-1}WT​=VT−1​和θ∗(2)=θ∗(V−1){\theta }_{ * }\left( 2\right) = {\theta }_{ * }\left( {V}^{-1}\right)θ∗​(2)=θ∗​(V−1)的第二步GMM{GMM}GMM估计量。同时假设假设1、3-7以及假设A.1-A.9成

2025-09-22 16:15:14 1063

原创 长期方差(Long-run Variance)与异方差自相关一致(Heteroskedasticity and Autocorrelation Consistent, HACC)估计量

特征长期方差 (S)HACC估计量 (S\hat{S}S本质理论参数估计量角色目标(Target)工具(Tool)/ 方法(Method)可知性未知,但存在可以用样本数据计算出来性质一个固定的值一个随机变量(不同样本得到不同估计)核心要求无一致性S→pSS→pS一个完美的类比:长期方差SSS就像是总体均值μ\muμ。它是一个描述总体性质的理论概念。HACC估计量S\hat{S}S就像是样本均值Xˉ\bar{X}Xˉ。它是我们用来估计总体均值的工具。“一致”

2025-09-22 15:51:35 889

原创 广义矩估计错误指定时的一个推导【续6】

附录作者证明思路定理2的证明。同样,设cT​T1/2H1T​H2T​2H2T​3→dN0Ω∗​A.9其中Ω∗​G∗′​WΩ11​WG∗​Ω22​G∗′​Ω33​G∗​G∗′​WΩ12​G∗′​WΩ13​G∗​Ω21​WG∗​G∗′​Ω31​WG∗​Ω23​G∗​G∗′​Ω32​。

2025-09-22 15:20:14 1183

原创 广义矩估计错误指定时的一个推导【续5】

在证明定理1、2和3时,我们使用以下结果。在假设1,2,4−61,2,4 - 61,2,4−6 和假设A.1-A.6的基础上,依据标准论证(例如,Newey 和 McFadden(1994,第2.1定理)以及 Wooldridge(1994,第7.1定理))得出θ^T→pθ∗.(A.6){\widehat{\theta }}_{T}\overset{\mathrm{p}}{ \rightarrow }{\theta }_{ * }. \tag{A.6}θT​→pθ∗​.(A.6)其中 θ∗{\thet

2025-09-22 14:50:11 1035

原创 广义矩估计错误指定时的一个推导【续4】

基准对照(情况 i):最简单的设定,用于建立直觉。标准第一步(情况 ii):分析过度识别模型的第一步估计。“最优”GMM的理论与实践(情况 iii & iv):这是论文的重中之重。它揭示了在误设下,理论上的最优权重(情况iii)和实践中使用的“最优”权重(情况iv)不再等价,并且会产生根本不同的结果。当你模型设定错误时,你从标准软件包中得到的那种“最优”GMM估计结果,其统计性质可能比你想象的要糟糕得多(例如,收敛速度更慢,分布可能退化)。

2025-09-22 14:19:28 924

原创 广义矩估计错误指定时的一个推导【续3】

要理解这一点,我们需要看清公式 (9) 是如何得出的,以及矩阵H∗H_*H∗​在其中扮演的角色。

2025-09-22 14:04:50 676

原创 广义矩估计错误指定时的一个推导【续2】

在GMM估计的渐近推导中,公式(9)是从公式(5)到(8)通过代入关键简化和代数操作得到的。

2025-09-22 11:48:37 957

原创 广义矩估计错误指定时的一个推导【续1】

H2T1H2T​1H2T1cTGTθT−GTθ∗′WTμ∗H2T​1cT​GT​θT​−GT​θ∗​′WT​μ∗​cTc_TcT​是缩放因子(通常cTTcT​T​GTθ∂gTθ∂θ′GT​θ∂gT​θ∂θ′是样本矩函数的导数矩阵(维度q×pq \times pq×pWTW_TWT​是加权矩阵(维度q×。

2025-09-22 11:36:26 885

原创 广义矩估计错误指定时的一个推导

是唯一的随机变量部分,因为它捕获了样本矩的随机波动,而其他项收敛到常数,因此在渐近分析中被视为非随机。这种处理是渐近理论的标准方法,允许我们推导估计量的渐近分布。这个推导是GMM渐近理论的基础,特别是在模型误设下,它揭示了估计量的收敛行为依赖于加权矩阵。在推导渐近分布时,我们通常将公式(4)右边的常数部分提取出来,只关注随机部分。被视为非随机(或渐近常数),是由于渐近理论中的关键性质和行为。在GMM估计的渐近推导中,公式(4)的右边之所以将。最后,为了得到公式(4),我们引入缩放因子。

2025-09-22 10:32:26 907

原创 什么是 可测的(measurable)?

它是一个技术性、基础性的假设,确保我们使用的数学对象(期望、概率)是定义良好的。它不同于连续性。可测性是关于函数能否被积分,而连续性是关于函数值是否平滑变化。在实践中,几乎所有你在应用中会遇到的经济学和统计学函数都是可测的(例如,连续函数、分段连续函数、单调函数等都是可测的)。这个假设主要是为了在理论推导中排除那些极端怪异、现实中几乎不存在的数学反例,从而保证理论的严谨性。所以,大致理解为:“我们假设这些函数足够规则,以便我们可以安全地对其进行积分和概率运算,而不会遇到数学上的麻烦。

2025-09-19 21:29:09 633

原创 什么是紧集(compact set)?

在有限维的欧几里得空间RpRp(这是我们处理参数向量θ\thetaθ一个集合是紧集,当且仅当它是 有界且封闭的。在计量经济学的语境中,当说“Θ\ThetaΘ参数空间Θ\ThetaΘ是明确设定的,而不是整个无穷的RpRp空间。这个设定好的空间是有界的(例如,所有参数的绝对值都小于某个很大的数BBB这个空间是封闭的(通常通过包含等号来实现,例如θ≤Bθ≤B而不是θB\theta < BθB这个假设是保证极值估计量具有良好大样本性质(如一致性)的。

2025-09-19 21:06:50 980

原创 SPSA为什么要求三阶可导

一阶可导保证了梯度。

2025-08-29 14:19:27 682

原创 迁移框架下的期望分位数回归的纠偏

模块核心作用数学体现领域差异隔离分离源域迁移与目标域适应,避免分布差异污染δ\deltaδ仅优化目标域数据(公式 2.20)噪声偏差修正用目标域无噪数据抵消隐私噪声的影响损失函数展开中的线性项(公式 2.21)局部特征适应使参数更贴合目标域的条件分位数特性(如偏态尾部分布)ρτ\rho_\tauρτ​对残差的非对称加权稀疏性保持通过 Lasso 控制增量δ\deltaδ的复杂度,避免纠偏破坏特征选择λδ∣δ∣1λδ​∣δ∣1​纠偏本质是两阶段估计的贝叶斯思想。

2025-08-18 13:46:03 505

原创 期望分位数回归的迁移学习

在迁移学习框架中,源域的选择确实基于其参数与目标域参数的相似性,具体通过 L1 范数距离(∥β−β(k)∥1\left\| \beta - \beta^{(k)} \right\|_1​β−β(k)​1​)是否小于阈值 hhh 来判定。以下是核心逻辑的详细解释:​β(0)−β(k)​1​≤h其中 hhh 是预设的阈值。满足该条件的源域称为 hhh-可迁移源域,纳入信息集 A\mathcal{A}A。几何意义:这等价于以目标域参数 β(0)\beta^{(0)}β(0) 为中心、hhh 为半径的 L1

2025-08-18 13:35:58 406

原创 Oracle algorithm的含义

在统计学领域,“Oracle algorithm”并非指代具体的数据库产品(如Oracle公司开发的数据库系统),而是指一类,其核心特性是。该术语在理论证明和算法评估中扮演重要角色,尤其在迁移学习、高维统计和模型选择等场景下常见。

2025-08-17 22:48:26 352

原创 损失函数的多元泰勒展开

多元泰勒展开的核心思想是利用多项式函数逼近多元函数在某点附近的局部行为。对于期望分位数回归损失函数 $\rho_{\tau}(y_i - x_i^{\top}\beta)$,在 $\beta=0$ 处的展开可表示为: $$ \rho_{\tau}(y_i - x_i^{\top}\beta) = \sum_{j=0}^{\infty} \sum_{\phi \in \Phi_j} \lambda_{\phi v_i} \phi(\beta) $$ 其中: 基函数 $\phi(\beta)=\beta_1^{

2025-08-17 21:53:52 1240

原创 期望分位数回归模型

SIC 是一个评价模型好坏的标准。它说:“一个好的模型,既要能很好地拟合数据(块(e)小),又不能太复杂(块(f)小)”。记住,模型是工具,理解每个部分的目的才能用好它。论文采用了Hu et al. (2015)和Liu et al. (2020)的思路,使用基于。今天我们深入讲解带约束的惩罚期望分位数回归模型以及如何选择它的关键参数。这些公式看起来有点复杂,但别担心,我们会一步步拆解,理解每个部分的含义和作用。受到L1惩罚项的调节(控制复杂度,选择特征),期望分位数损失(聚焦于数据分布的特定位置),

2025-08-17 17:13:36 989

原创 广义矩估计随机近似中1.2和2.1的差异

—它证明:通过精心设计的样本分割和冻结策略,流式算法也能达到离线GMM的统计效率极限。1.2节的S2SLS和2.1节的SGMM虽然公式相似,但存在。1.2和2.1的差异。

2025-08-14 22:17:29 964

原创 广义矩估计随机近似中公式(2d)的推导

摘要: GMM估计中权重矩阵的最优性条件要求使用矩条件协方差矩阵的逆(Ω⁻¹)。在线性工具变量回归中,若满足同方差假设,最优权重矩阵可简化为工具变量协方差矩阵的逆(Q⁻¹)。在线算法选择Q⁻¹而非Ω⁻¹,主要基于计算可行性:Q⁻¹可直接通过Sherman-Morrison-Woodbury(SMW)公式在线高效更新(复杂度O(d²)),而Ω⁻¹需已知残差参数导致循环依赖。SGMM通过两阶段权衡实现一致性,第一阶段用Q⁻¹估计初始参数,第二阶段可周期性重构Ω⁻¹提升效率。SMW公式将矩阵求逆转化为标量运算,通

2025-08-14 15:57:42 918

原创 Polyak-Ruppert 平均

(如 SGD)设计的平均技术,由 Boris Polyak(1990)和 David Ruppert(1988)独立提出。它不仅仅是简单的算术平均,而是一种具有。:Polyak-Ruppert 平均是流数据处理的“精装修版”递归平均——它在普通平均的框架上,加装了。当你的目标是高精度在线估计时,指名调用它就是获得统计效率保证的密钥。:Polyak 平均的“特殊之处”不在计算公式,而在其。生成的序列(如 SGD 参数、MCMC 样本)。——它针对的是 SGD 的迭代序列。

2025-08-14 11:08:08 1050

原创 广义矩估计的随机近似下的递归平均

流式递归平均:通用高效的在线统计算法 公式 (2b) 和 (2e) 采用流式递归平均方法,是处理流数据的核心算法。其核心思想是通过加权融合新数据与历史均值,实现无需存储全部数据的高效计算。 关键优势: 内存高效(O(1)空间复杂度) 在线更新(O(1)时间复杂度/样本) 保持统计性质(无偏性、强一致性) 应用场景: 任何可加统计量(均值、方差、协方差等) 实时系统(传感器、金融数据流等) 该方法是流数据计算的通用范式,在SGMM中用于保证雅可比矩阵估计和参数估计的统计有效性。

2025-08-14 10:54:39 948

原创 广义矩估计的随机近似中的一个推导

牛顿步长在广义矩估计(GMM)中的推导基于目标函数的局部二次近似。通过泰勒展开,将梯度与海森矩阵代入求解极小值点,得到更新公式:β^(k+1)=β^(k)-(G_n'W G_n)^(-1)G_n'W \bar{g}_n(β^(k))。这一方法不仅能自适应调整步长,在线性GMM中更等价于一步估计量。在在线学习场景下,通过样本替代和历史平均,实现了高效的随机牛顿步长更新,兼具优化效率与统计有效性。

2025-08-14 10:44:23 1062

原创 两阶段最小二乘法(2SLS)与 工具变量(IV)模型

工具变量对解释变量的投影。:工具变量对因变量的加权。

2025-08-13 19:26:26 1617

原创 IV模型(工具变量模型)

将传统IV估计扩展至大规模流数据场景,在保持渐近性质的同时显著提升计算效率。理解这一模型对掌握现代高维计量方法至关重要。,其核心是通过工具变量剥离解释变量与误差项的相关性。本文提出的SGMM算法,通过。工具变量通过“出生季度→教育年限→收入”的间接路径,剥离内生性干扰。论文针对传统GMM的瓶颈(需全样本计算),提出。),则最小二乘法(OLS)估计量。为权重矩阵(如最优权重。IV模型是解决内生性问题的。

2025-08-13 17:00:55 731

原创 汉森(1982)提出的广义矩估计法

摘要:汉森(1982)提出的广义矩估计法(GMM)是计量经济学中重要的参数估计方法。该方法通过使样本矩接近理论矩来估计参数,适用于过度识别情形。GMM估计具有一致性、渐进正态性和有效性特点,广泛应用于工具变量回归、资产定价模型等领域。与传统GMM相比,随机GMM(SGMM)实现了在线流式处理、更低内存需求和更快计算速度,同时保持相同的渐进性质。模拟结果显示SGMM在保持估计精度的同时显著提升了计算效率。

2025-08-11 14:28:45 1086

原创 将文件移入回收站而不是直接删除

选项被默认选中且呈灰色无法修改,可能是由于系统策略限制、权限问题或注册表被锁定。新配置的电脑,删除的文件夹,没有在回收站里面,而是错误的直接删除了,这显然不符合我的要求,如何解决?完成修改后,重启电脑并测试删除文件是否正常进入回收站。Windows 组件。

2025-07-25 19:21:33 879

原创 Matplotlib 中调整 坐标轴和刻度线粗细

Matplotlib坐标轴样式调整指南 本文介绍了Matplotlib中调整坐标轴刻度和轴线样式的多种方法。对于刻度线调整,推荐使用tick_params()函数,可单独控制主次刻度的宽度、长度和颜色,支持面向对象和全局配置方式。轴线粗细可通过spines对象设置,支持单独调整各边轴线和隐藏特定轴线。两种调整都提供了全局默认设置选项(rcParams)。完整示例演示了如何组合使用这些方法,包括启用次刻度、设置网格线等注意事项。建议将刻度线和轴线宽度设为1.5-3磅,使用深色以确保打印清晰度。这些方法使科研图

2025-07-17 13:03:33 892

原创 Matplotlib 轴标题与刻度字号调整方法

Matplotlib 轴标题与刻度字号调整方法摘要 轴标题调整 xlabel()/ylabel():直接设置字号(fontsize=14) rcParams全局设置:plt.rcParams['axes.labelsize'] = 14 面向对象方式:通过ax.set_xlabel(fontsize=14) 刻度字号调整 tick_params():plt.tick_params(axis='both', labelsize=14) 单独设置:plt.xticks(fontsize=14) 全局设置:修改p

2025-07-17 10:36:26 428

原创 linux wsl2 docker 镜像复用快速方法

摘要:要将单个b.py文件集成到现有A项目的开发环境中,推荐使用Docker方式。方法一:通过Docker命令行构建镜像并运行容器执行b.py;方法二(推荐):在VS Code中创建.devcontainer配置,复用A项目的Docker环境;方法三:启动交互式容器直接开发。关键配置包括路径映射、工作目录设置和GPU支持。验证成功后可看到JAX正确识别GPU设备。建议创建可重用模板项目,方便后续开发复用环境配置。(150字)

2025-07-08 20:23:31 569

原创 latex Beamer中图片、表格设置显示序号

摘要:在Beamer的Boadilla主题中实现表格自动编号有两种方法:1) 在导言区添加\setbeamertemplate{caption}[numbered]启用全局编号;2) 自定义标题格式如\setbeamertemplate{caption label}{\inserttablenumber. }修改编号样式。两种方式均可将默认"Table:"格式转为"Table 1:"的自动编号效果,需注意加载booktabs包支持三线表格式,并通过\ref{}正确引用

2025-07-04 14:11:35 355

好好画词云图,完整项目数据和代码

博主拿出压箱底的优质代码,和小伙伴们一起品鉴! - 画出词云图 - 指定词云图形状 - 多个文本批量生成多张词云图 - 加词库,添加所有感兴趣的词语 - 停词库,筛选掉所有不感兴趣的词语,融合了四个国内主流停词库(`7352个停词`) - 忽略单个字符 - 控制图片大小、颜色、字体与频率大小 - 自动保存高分辨率词云图到本地

2023-04-07

亚马逊的评论数据集(3.6M的文本评论内容及其标签)

亚马逊的评论数据集(3.6M的文本评论内容及其标签)

2023-03-26

知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

这是一款实体关系联合标注的本地小程序,以Python3实现。本系统是一种标注文本语料中命名实体与关系或属性的半自动化软件系统,应用Python编程实现可视化界面和主要功能.

2022-10-31

采集到的重庆二手房重庆房地产数据.xlsx

重庆市各个区县房价户型等原始数据xlsx表格

2021-04-09

方差分析chenyi.py

博主课程作业,自定义模块,实现多种情况方差分析

2021-12-12

深圳二手房交易信息.csv

网络爬虫采集

2021-04-09

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除