1936
政策关联程度指标(1992-2024)
数据简介
企业政策相似度是借助自然语言处理技术量化企业年报与政府工作报告文本关联度的核心指标,其价值在于实现多维度政策效果评估与微观企业行为分析的创新融合。该数据集运用 Word2Vec 词向量模型与余弦相似度算法,将非结构化文本转化为可量化的结构化指标,突破传统政策量化方法局限,为追踪企业对产业政策的响应灵敏度提供动态视角。
研究表明,政策相似度既能有效识别受政策激励的民营企业、中小企业及东部地区企业群体,又揭示了政策传导的双重机制:短期通过降低融资约束、增加政府补贴提升业绩,长期推动企业基于政策导向优化战略布局。此数据集为评估政策执行效率、识别政策敏感行业、优化资源配置提供实证支撑,同时为政府调整政策工具、企业制定合规战略提供数据驱动的决策依据,兼具学术创新性与实践应用价值。数据构建参考覃飞、沈艳(2021)研究方法,形成电子商务进农村综合示范县数据集。
具体流程为:先对政府工作报告与企业年报进行分词,通过正则表达式过滤非中文字符并剔除停用词;再利用智能文件名解析器提取企业代码、名称及年份信息;构建含政府文本(重复 3 次强化语义)与企业文本的混合语料库,训练 300 维 Word2Vec 词向量模型;采用词向量均值法生成文本表征,计算企业年报与同年政府报告的余弦相似度;最后通过 min - max 标准化处理,将结果映射至 [0,1] 区间,输出包含标准化政策相似度、企业代码、简称及年份的排序数据。相似度越接近 1,政策导向一致性越高,该标准化处理实现了跨年份、跨企业数据的可比性,为后续政策影响分析奠定标准化度量基础。
数据范围
A股上市公司
时间跨度
1992年-2024年
数据格式
数据格式为Excel形式
数据指标
相关研究
政策关联作为近年来经济学与管理学交叉研究的重要议题,逐渐成为学者们探讨政策效应与企业行为关系的核心视角。现有研究主要围绕政策关联的测度方法、影响因素及其经济后果展开,并逐步深入到异质性分析与机制检验。本文基于既有文献,从政策关联的经济效应、异质性影响及作用机制三个方面进行系统梳理,以期为后续研究提供理论参考。