1991-2024年上市公司数智化词频数据

企业数智化转型作为系统性工程,其评估指标的核心价值体现在对数字化与智能化融合程度的客观度量。本研究采用Python文本分析技术,通过构建关键词词频指标体系,不仅能够准确反映企业技术应用现状,还可实现转型进程的动态监测,为观察企业行为变革提供微观数据支撑。该指标具有重要的学术价值:其一,突破了传统数字化转型研究局限于治理效率与市场表现的框架,将研究视野拓展至信息披露策略领域;其二,通过实证数智化技术对传统量化预测信息的替代作用,揭示了企业通过非正式渠道进行定性披露的新型风险规避与沟通优化模式,为数字经济时代信息披露研究提供了新视角。

在具体实施层面,研究选取A股上市公司年报作为基础数据源,依据行业分类标准排除了金融保险类企业及ST等特殊样本。数据处理过程包括:1)采用中文分词技术对年报文本进行预处理;2)参照哈工大停用词表过滤无效词汇;3)基于专业词典(包含"智能金融合约"、"机器学习"、"深度学习"等典型术语)识别数智化特征词。通过计算特征词绝对频次及其文本占比,并实施对数化处理(ln(x+1))以修正右偏分布,最终形成包含股票代码、公司名称、词频统计等要素的结构化数据集。该数据集可为监管政策制定和投资决策提供数据支持。

数据说明:

  • 来源:A股上市公司年报(人工校验)
  • 时间范围:1991-2024年
  • 覆盖范围:全部A股上市公司(金融保险业除外)
  • 存储格式:Excel

数据指标

股票代码、公司名称、年份、总文本词数、对数化词频、标准化词频

数据展示

参考文献

[1]刘凌冰,王语彤,耿会欣.企业数智化与量化预算目标信息披露行为[J].会计研究,2024,(11):63-78.

【下载→

方式一(推荐):主页 ↓个人↓简介

经管数据库-优快云博客

方式二:数据下载地址汇总_-优快云博客

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值