1998-2024年上市公司人工智能词频年报文本统计

最新推荐文章于 2025-12-08 16:38:51 发布

原创最新推荐文章于 2025-12-08 16:38:51 发布 · 638 阅读

7 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #搜索引擎 #数据分析

参考《管理世界》中姚加权（2024）的做法，团队根据上市年报文本内容，对73个人工智能的相关词频进行统计，并计算上市公司-人工智能水平，包括精确词汇、扩展词汇两种方式

在前文，利用上市公司年报文本全文数据，对“人工智能”73个相关词频进行了统计，衡量上市公司人工智能水平，本次继续更新数据至2024年

一、数据介绍

数据名称：上市公司人工智能-年报词频统计

数据范围：A股上市公司

数据年份：1998-2024年

样本数量：68470条，85个变量

数据说明：内含人工智能73个词频、精确和扩展词汇两种方式

二、整理说明

➤爬取上市公司年报原始文件1998-2024年

➤将原始报告文本整理为面板数据

➤统计年报全文的文本长度

➤统计全文中，中英文部分的文本长度

➤构建人工智能术语词典，将词汇扩充到python的jieba库

➤去除停顿词，统计精确词汇、扩展词汇数目

➤计算两种方式下的人工智能水平

三、指标说明

四、数据概览

上市公司数目

上市公司人工智能-excel版本

上市公司人工智能-stata版本

【下载→

方式一（推荐）：主页 ↓个人↓简介

经管数据库-优快云博客

方式二：数据下载地址汇总_-优快云博客

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

经管数据库

关注关注

9
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

上市公司年报数字化词频统计Python代码&数据2010-2023

qq_52891550的博客

04-14

3091

数字化转型是以数字化技术为核心,从操作、管理、服务等多个角度,对不同领域进行全方位的数据分析、优化和应用。从年报MD&A提取领域词频进行分析已经是近两年的热点话题，本文以2010-2023年年报为例，进行数字化词频统计，完整数据代码@“经管有数”。

更新！企业数字化转型-MD&A报告314个词频、文本统计（2001-2024年）

06-09

➤爬取2001-2024年上市公司年报 ➤将MD&A报告文本整理为面板数据 ➤统计年报全文的文本长度 ➤统计全文中，中英文部分的文本长度 ➤构建数字化术语词典，将词汇扩充到python的jieba库 ➤去除停顿词，统计精确...

参与评论您还未登录，请先登录后发表或查看评论

更新！上市公司人工智能-年报73个词频、文本统计（1998-2024年）

09-25

注：2025年5月更新。本次数据更新至2024年，根据最新年报文本整理参考《管理世界》中姚加权（2024）的做法，团队根据上市年报文本内容，对73个人工智能的相关词频进行统计，并计算上市公司-人工智能水平，包括精确词汇、扩展词汇两种方式在前文，团队利用上市公司年报文本全文数据，对“人工智能”73个相关词频进行了统计，衡量上市公司人工智能水平，本次团队继续更新数据至2024年相关数据：上市公司MD&A人工智能词频，人工智能企业数据库，上市公司年报原文数据，数字化转型词频数据，MD&A数字化词频数据一、数据介绍数据名称：上市公司人工智能-年报词频统计数据范围：A股上市公司 数据年份：1998-2024年样本数量：68470条，85个变量更新时间：2025年5月数据说明：内含人工智能73个词频、精确和扩展词汇两种方式二、整理说明 ➤爬取上市公司年报原始文件1998-2024年 ➤将原始报告文本整理为面板数据 ➤统计年报全文的文本长度 ➤统计全文中，中英文部分的文本长度 ➤构建人工智能术语词典，将词汇扩充到python的jieba库 ➤去除停顿词，统计精确词汇、扩展词汇数目 ➤计算两种方式下的人工智能水平

人工智能python代码_人工智能-python 生成词云（词频统计）图

weixin_39716971的博客

11-23

391

生成的词云图，如下：安装wordcloud，jieba，其他包自行安装：conda install -c conda-forge wordcloudconda install -c conda-forge jieba注：conda-forge是github的一个组织，提供了conda recipes库，就是一份相互关联的可打包在一起的东西。具体使用方法如上，首先加上conda-forge，然后安装...

1998-2024年上市公司人工智能年报73个词频、文本统计

xiaozhuzhu1995的博客

11-05

642

参考《管理世界》中姚加权（2024）的做法，团队根据上市年报文本内容，对73个人工智能的相关词频进行统计，并计算上市公司-人工智能水平，包括精确词汇、扩展词汇两种方式。在前文，利用上市公司年报文本全文数据，对“人工智能”73个相关词频进行了统计，衡量上市公司人工智能水平，本次继续更新数据至2024年。➤构建人工智能术语词典，将词汇扩充到python的jieba库。数据说明：内含人工智能73个词频、精确和扩展词汇两种方式。数据名称：上市公司人工智能-年报词频统计。➤去除停顿词，统计精确词汇、扩展词汇数目。

1998-2024年上市公司供应链金融文本词频数据

xiaozhuzhu1995的博客

10-12

410

借鉴王少华（2025）、周兰（2022）、张黎娜（2021）等人的研究方法，根据上市公司年报文本内容，采用供应链金融关键词词频统计的方法，对供应链金融的相关词频明细数据进行统计，并计算上市公司供应链金融水平。[1]张黎娜,苏雪莎,袁磊.供应链金融与企业数字化转型——异质性特征、渠道机制与非信任环境下的效应差异[J].金融经济学研究,2021,36(06):51-67.[2]周兰,吴慧君.供应链金融与产品市场表现[J].金融经济学研究,2022,37(06):99-112.供应链金融B：供应链金融关键词。

上市公司人工智能年报词频文本统计(73个词频)（1999-2023年）

paperdata666的博客

11-15

1296

参考《管理世界》中姚加权（2024）的方法，团队根据上市年报文本内容，对73个人工智能的相关词频进行统计，并计算上市公司-人工智能水平，包括精确词汇、扩展词汇两种方式。利用上市公司年报文本全文数据对“人工智能”73个相关词频进行了统计，最终衡量上市公司人工智能水平。[1]姚加权,张锟澎,郭李鹏,等.人工智能如何提升企业生产效率？——基于劳动力技能结构调整的视角[J].管理世界,2024,40(02):101-116+133+117-122.数据名称：上市公司人工智能年报73个词频文本统计。

1998-2024年上市公司生成式人工智能文本词频明细数据

paperdata666的博客

11-04

289

生成式人工智能是人工智能的一个重要分支，它通过深度学习模型学习文本、图像、音频、代码等数据中的规律，从而具备“创作”能力。生成式AI不仅能撰写文章、绘制图像、编写程序、作曲或生成视频，还能辅助科研、教育、金融、设计等领域实现智能化创新。》一文中对生成式人工智能文本词频的做法，采用生成式人工智能关键词在企业年报信息中出现的次数作为企业生成式人工智能水平的代理指标。第三步，根据分词词典使用 python 语言编程对年报文本内容进行分词与文本抓取，统计文中出现的生成式人工智能特征词词数。数据范围：A股上市公司。

1991-2024年上市公司数智化词频数据

paperdata666的博客

06-19

226

本研究采用Python文本分析技术，通过构建关键词词频指标体系，不仅能够准确反映企业技术应用现状，还可实现转型进程的动态监测，为观察企业行为变革提供微观数据支撑。其二，通过实证数智化技术对传统量化预测信息的替代作用，揭示了企业通过非正式渠道进行定性披露的新型风险规避与沟通优化模式，为数字经济时代信息披露研究提供了新视角。通过计算特征词绝对频次及其文本占比，并实施对数化处理（ln(x+1)）以修正右偏分布，最终形成包含股票代码、公司名称、词频统计等要素的结构化数据集。方式一（推荐）：主页 ↓个人↓简介。

上市公司年报人工智能词频2000-2024年

m0_46373735的博客

12-06

139

01、数据介绍基于《管理世界》姚加权（2024）研究方法的上市公司人工智能水平测算，整理上市公司年报文本语料，对文本中出现“人工智能”，筛选与种子词语义相近的词汇，最终形成73个词，统计年报中73个词典词汇的出现频次，结合上下文匹配关联短语形成扩展词汇统计。

2010-2024年上市公司AI技术与AI叙事词频数据

paperdata666的博客

11-11

723

在数字经济深度渗透与 AI 技术快速迭代的背景下，上市公司作为市场创新主体，其 AI 技术应用布局与 AI 叙事表达（即管理层对 AI 价值、战略的阐述）已成为反映企业技术竞争力与发展潜力的核心维度。该数据可支撑学术界探究企业 AI 战略演化规律、AI 叙事与技术落地的协同性，以及 AI 因素对企业绩效、市场估值的影响机制，同时为政策制定者评估 AI 产业政策在企业层面的传导效果提供微观数据支撑，填补了现有研究中 “企业 AI 叙事文本量化” 与 “技术实践关联分析” 的数据空白。数据层级为上市公司级;

2001-2024年上市公司智能制造词频统计-最新出炉.zip

10-22

2001-2024年上市公司智能制造词频统计的分析，为理解这个时期内智能制造的发展趋势、技术热点、行业动态提供了宝贵的视角。统计工作通常涉及到对大量的文本数据进行处理，包括但不限于上市公司年报、季报、新闻发布...

5月更新上市公司年报文本、整理面板（1998-2024年）

06-09

上市公司人工智能-MD&A词频统计数据（2001-2024年）

09-25

数据名称：上市公司人工智能-MD&A报告73个词频、文本统计数据范围：A股上市公司 数据年份：2001-2024年样本数量：65483条，83个变量数据来源：上市公司“管理层讨论与分析”文本数据说明：内含人工智能73...

【论文速递】2025年第34周(Aug-17-23)(Robotics/Embodied AI/LLM)

淋曦的进击手记

12-07

989

自我监督的学习有望消除对手动数据注释的需求，从而使模型能够毫不费力地扩展到大规模的数据集和较大的体系结构。通过不针对特定的任务或领域量身定制，这种训练范式有可能使用单个算法从不同的来源学习视觉表示形式，从自然到航空图像。该技术报告介绍了Dinov3，这是通过利用简单而有效的策略来实现这一愿景的主要里程碑。首先，我们利用仔细的数据准备，设计和优化来扩展数据集和模型大小的好处。其次，我们介绍了一种称为GRAM锚定的新方法，该方法有效地解决了长期训练时间表中已知但未解决的密集特征映射降解的问题。

人工智能的基石之三：硬件

最简单的方法，解决最实际的问题。

12-05

658

高性能硬件是人工智能的基石，尤其是在机器学习和深度学习领域，海量数据是常态。从充当计算机大脑的中央处理器 (CPU) 到加速计算的图形处理器 (GPU)，硬件的作用是提供处理和运行复杂数据算法所需的原始能力。

AI泡沫什么时候破？

脑极体

12-04

691

而AI企业面对的短期形势，可能更为严峻。而AI公司和技术服务商，为了迎合决策者或拿下B端大项目，往往不计成本的低价竞标，无视人工成本的驻场开发，技术价值让位于领导偏好，企业自身也深陷人效黑洞，沦为挣辛苦钱的技术外包。To B/G不赚钱，To C也卖不上价，所以目前AI领域唯一清晰的商业模式，就是类似英伟达的“卖铲人”模式，卖加速卡和算力的企业成了这一轮AI浪潮的最大受益人。去伪存真之后，资本会冷却，叙事会修正，共识会重新凝聚，而那些持续追问“AI如何创造真实价值”的人，会与行业一同穿越周期，走向成熟。

【AI是否能替代IT从业者？】

博文致力于人工智能算法的探索研究；前后端分离项目的技术分享交流；专升本计算机基础课程内容讲解；各种中间件技术分享

12-03

1165

2025年IT行业面临AI深度重构：基础开发、测试、运维岗位替代率超60%，但AI相关新兴岗位激增380%。人类在复杂系统设计、伦理决策和跨界融合领域仍具不可替代性。微软等企业实践显示，人机协作可使效率提升40%。从业者需转型高价值领域（如Agent开发、大模型工程），掌握"技术+领域"双轨能力。AI本质是职业生态重构器，持续学习者的薪资溢价可达150%。建议立即评估岗位AI暴露指数，优先学习分布式架构优化、多智能体开发等技能。

宝马，如何建设一座AI汽车工厂？｜产业AI案例