参考《经济研究》中戴魁早等(2024)一文《数据要素与服务型制造发展》对数据要素指标构建的思路和方法,统计上市公司年报文本中数据要素关键词出现次数,以其对数衡量企业层面数据要素开发利用情况
“企业数据要素开发利用指数”主要选用了反映数据要素存量、数据开发能力、数据驱动商业应用、数据价值变现等四个方面的关键词
整理步骤如下:
➤第一步,整理所有样本企业的上市公司年报并将其转化为纯文本格式
➤第二步,确定数据要素种子词搜索范围
➤第三步,根据分词词典使用 python 语言编程对年报文本内容进行分词与文本抓取,统计文中出现的数据要素特征词词数
➤第四步,对词数加一取自然对数
一、数据介绍
数据名称:上市公司数据要素利用水平-词频明细
数据范围:A股上市公司
时间范围:1998-2024年
样本数量:68471条
数据来源:上市公司年报
二、数据指标

三、参考文献
[1]戴魁早,黄姿,梁银笛.数据要素与服务型制造发展[J].经济研究,2024,59(12):95-112.
[2]唐要家,王钰,唐春晖.数字经济、市场结构与创新绩效[J].中国工业经济,2022,(10):62-80.
四、数据概览
数据要素利用水平构建及关键词

数据要素利用水平词频-各年企业数量

数据要素利用水平词频-Excel版

数据要素利用水平词频-Stata版

【下载→
方式一(推荐):主页 ↓个人↓简介
方式二:数据下载地址汇总_-优快云博客
643

被折叠的 条评论
为什么被折叠?



