参考钞小静等(2021)、李小明等(2025)的做法,根据中央、各省、市级政府工作报告,整理和统计数字基础设施51个词频,以衡量数字基础设施水平


一、数据介绍
数据名称:数字基础设施水平-地级市、省级、中央
数据范围:地级市、省级、中央
时间范围:中央(1954-2025)、省级(2002-2025)、地级市(2002-2025)
样本数量:6791条
数据来源:地方政府网站
更多说明:内含数字基础设施相关的51个词频明细、扩展词频
二、整理说明
➤从地方政府网爬取工作报告原始文件
➤将报告文本整理为面板数据
➤去除停顿词,利用python的jieba库进行精确模式和全模式分词,统计词频和
➤保留中英文、数字、标点符号,利用正则表达式统计51个精确词频
➤利用正则表达式统计数字基础设施相关51个扩展词频
➤保留中英文、数字,统计全文文本总长度
➤保存文本词频总数、51个词频明细、文本长度
三、数据指标

四、参考文献
[1]钞小静,廉园梅,罗鎏锴.新型数字基础设施对制造业高质量发展的影响[J].财贸研究,2021,32(10):1-13.
[2]钞小静,薛志欣,孙艺鸣.新型数字基础设施如何影响对外贸易升级——来自中国地级及以上城市的经验证据[J].经济科学,2020,(03):46-59.
[3]李小明,刘雅迪,汪婵,等.破解环境规制的“增长困局”:数字经济的对冲效应[J].经济学动态,2025,(09):19-38.
五、数据概览
平衡面板-省级(2002-2025年)

非平衡面板-地级市

数字基础设施水平-中央级
数字基础设施水平-省级

数字基础设施水平-地级市

【下载→
方式一(推荐):主页 ↓个人↓简介
方式二:数据下载地址汇总_-优快云博客
1382

被折叠的 条评论
为什么被折叠?



