数据简介
为应对气候变化及实现碳中和目标, 碳市场已成为我国实现减排目标的重要政策工具,然而, 我国碳市场存在价格波动幅度过大的现实问题。. 碳市场价格的剧烈波动不仅极大地影响投资者对碳市场未来的发展信心, 也会引发企业的担忧并推迟减排投资, 对碳市场机制的环境有效性构成挑战。媒体气候情绪对碳市场价格异常波动的影响不容忽视。媒体气候情绪会通过引导交易者的心理预期和交易行为对碳市场波动构成影响。鉴于此, 本数据基于新闻报道中气候变化相关文本提取情绪信息, 使用词典法构建媒体气候情绪指数。
本数据选取国内三大最具权威性与影响力的主流媒体作为数据来源, 《人民日报》《光明日报》《经济日报》, 获得了 2013 年 1 月 1 日至 2022 年 12 月 31 日期间的新闻文本数据. 为从全部样本中筛选出与气候变化相关的文本, 需要确定一组搜索关键词. 本数据选取参考文献中确定的关键词“气候变化” “全球变暖” “碳排放” “温室效应” “新能源” “太阳能” “碳汇” “节能” “减排” “污染” “温室气体”从全部文本中筛选含有以上任一关键词的文章。然后本数据首先以获取的气候变化新闻文本作为语料库, 运用词频-逆文档频率 (TF-IDF) 和 TextRaor 算法选择种子词, 进行气候情绪词典构建。得到种子词后, 加入姜富伟等 构建的中文金融情感词典, 用于情感判断。同时人工补充影响气候情绪的政治性词语和灾害类词语 , 构建形成最终的气候情绪词典. 本数据将词典中的词语积极赋值为 1, 消极赋值为-1, 以便后续计算情感得分. 在计算得分时, 引入《知网 Hoeoet》情感分析用词语集中的否定词典和程度词典, 使文本情绪更加精准。首先,对得到的气候变化文本进行清洗处理,去除无效字符、链接等,并只保留每月文本数据中包含关键词的语句。其次,加入知网词典中的程度副词否定词,使用考虑句法结构的气候情绪指标构建方法,即只量化匹配到主题词的句子,出现程度词进行成倍的加强或减弱,出现否定词则计算否定系数(奇数个为-1,偶数个为+1),将新闻中所有句子的得分加总得到当日指数,月度指数取平均值。具体计算公式如下:

数据来源
本文的数据主要来源于《人民日报》《光明日报》《经济日报》收集
时间跨度
《光明日报》:1985.1-2025.4
《人民日报》:2019.1-2025.7
《经济日报》:2021.1-2025.1
数据范围
《人民日报》《光明日报》《经济日报》
数据格式
excel形式
数据指标
![]()
数据展示

参考文献
[1]刘振华,王昱舒,袁馨婷,等.媒体气候情绪与碳市场波动预测——基于新闻文本分析的经验证据[J/OL].系统工程理论与实践,1-20[2025-07-23].
【下载→
方式一(推荐):主页 ↓个人↓简介
方式二:数据下载地址汇总_-优快云博客
基于媒体报道的气候情绪指数构建

被折叠的 条评论
为什么被折叠?



