
数据处理
文章平均质量分 90
KEMOSABEr
这个作者很懒,什么都没留下…
展开
-
中国工业企业数据库 | 特殊样本统计
这篇推文是对本公众号早期推文的思考,漏洞在所难免,欢迎指出。Note:Note:Note: 该文首发于微信公众号DMETP,欢迎关注!在对中国工业企业数据库进行数据清洗之后,一个伴随而来的问题是:数据清洗本身会否影响估计结果?之所以进行数据清洗,绝不仅仅是为了逼近所谓的“研究范式”,更多在于使得估计结果更能反映“平均水准”,或者确保参与回归的样本的固有特征不存在系统性偏差(这里有点类似于PSM),比如为了排除极端值的干扰,一般都会对连续型变量进行缩尾/截尾处理;比如为了保证所有样本企业的资产负债指原创 2021-11-02 21:34:20 · 1101 阅读 · 0 评论 -
数据处理 | 一些野路子
这期推送简单介绍一下我在以往清洗数据的过程中用过的一些野路子。这期推文其实在上期之后就一直在构思,只是在实际落地的时候有一些小问题需要解决,然后这段时间又在忙其他事情,所以就一直拖到了现在……Note:Note:Note: 1、下划线字体为链接,可点击跳转;2、推文中的公式与代码块均可左右滑动;3、该文首发于微信公众号DMETP,欢迎关注;4、需要本次推送所使用的数据和代码的朋友,可以在公众号后台对话框内回复关键词coups;5、文中所有外部命令均可通过以下方式获得,以高维固定效应估计命令reghdf原创 2021-09-08 10:29:52 · 4315 阅读 · 0 评论