1995-2022年各省能源消费总量数据(万吨标煤)
1995-2022年各省能源消费总量数据(万吨标煤)
1、时间:1995-2022年
2、范围:30省市不含西藏
3、来源:能源统计年NJ、各省NJ
3、指标: 能源消费总量
4、单位:万吨标煤
5、缺失情况:2022年内蒙古、福建和新疆缺失,其中湖南2020、2021、2022年根据能源消费总量增速计算,其余省份均无缺失
全国342个城市往返最短通勤时间(铁路)数据.xlsx
全国342个城市往返最短通勤时间(铁路)数据
1、时间:采集时间是2022年
2、来源:12306
3、数据说明:数据采集12306数据,整理全国342个城市往返最短通勤时间,本数据是铁路包含动车、高铁所有路线最短通勤时间,可用于时间距离矩阵测算、引力模型测算城市空间联系等。
航空运输主要远距离运输以及水运受到特殊地理位置限制未将航空和水路纳入考量范围。
高铁是城市通勤最快捷的交通工具之一,随着高铁的普及,每个城市之间空间相对距离变化越来越显著,城市之间的通勤比地理距离更能准确的衡量空间距离。
1995-2022年全球各国经济自由度指数数据.xlsx
1995-2022年全球经济自由度指数数据
1、时间:1995-2022年
2、范围:全球
3、指标:
Name、Index Year、OverallScore、PropertyRights、JudicialEffectiveness、GovernmentIntegrity、TaxBurden、GovernmentSpending、FiscalHealth、BusinessFreedom、LaborFreedom、MonetaryFreedom、TradeFreedom、InvestmentFreedom、FinancialFreedom
财政自由度、贸易自由度、商业自由度、货币自由度、劳动力自由度、投资自由度、金融自由度等
4、来源:美国传统基金会
5、说明:根据得分,所有国家和地区被分为如下5个等别:完全自由(80-100)、比较自由(70-79.9)、有限度自由(60-69.9)、比较压制(50-50.9)、压制(0-49.9)。
1999-2023年上市公司环境不确定性数据(含原始数据+计算代码+计算过程)
1999-2023年上市公司环境不确定性数据(含原始数据+计算代码+计算过程)
1、时间:1999-2023年
2、来源:上市公司NB
3、指标:股票代码、股票代码、年份、行业代码、行业名称、销售收入、行业大类、行业大类编码、企业分组编码、销售收入的平均值、非正常销售收入的标准差、未经行业调整的环境不确定性、行业环境不确定性、行业调整后的环境不确定性
4、范围:上市公司
5、计算方法:用过去5年销售收入的标准差并经行业调整后的值来衡量公司的环境不确定性
6、参考文献:申慧慧,于鹏,吴联生.国有股权、环境不确定性与投资效率
7、指标解释:
环境不确定性的根源存在于外部环境,而外部环境的变化将引起企业核心业务活动的波动,并最终导致企业销售收入的波动,因此,环境不确定性可以用公司业绩波动来予以衡量
2010-2021年商业银行数字化转型指数数据
2010-2021年商业银行数字化转型指数数据
1、时间:2010-2021年
2、来源:北大数字金融研究中心
3、指标:编号、银行名称、银行类型、年份、战略数字化、业务数字化、管理数字化、数字化总指数
4、范围:共246家,其中包括6家国有大型商业银行,12家股份制商业银行,128家城市商业银行,54家农村商业银行,29家外资银行和17家民营银行
5、方法:主成分分析法
6、参考文献:谢绚丽、王诗卉,“中国商业银行数字化转型:测度、进程及影响”
2000-2022年上市公司客户、供应商集中度数据
2000-2022年上市公司客户、供应商集中度数据
1、时间:2000-2022年
2、来源:上市公司NB
3、指标:年份、股票代码、股票简称、行业代码、省份、城市、省份代码、城市代码、上市状态、前五名客户产生的营业收入_亿元、占全年营业收入的比例、前五名供应商产生的采购额_亿元、占全年采购总额的比例、供应链集中度
4、范围:A股上市公司
5、样本量:5.2W+
6、方法说明:以客户集中度和供应商集中度之和衡量企业供应链集中度,其中客户集中度以前五名客户产生的营业收入占比衡量,供应商集中度以前五名供应商产生的采购额占比衡量
7、参考文献:吴安兵,龚星宇,陈创练等.非金融企业影子银行化的风险承担效应:内在机制与经验证据
邱保印,余梦,左静静.社会信用体系建设能否促进企业数字化转型?——基于社会信用体系改革试点的准自然实验
1992-2023年全国及31省对外开放度测算数据(含原始数据+计算过程+结果).xls
1992-2023年全国及31省对外开放度测算数据(含原始数据+计算过程+结果)(无缺失)
1、时间:1992-2023年
2、来源:各省NJ、国家统计J、统计GB
3、指标:进出口总额(万美元)、进出口总额(亿元)、汇率(年平均价)、国内生产总值(亿元)、对外开放度
4、范围:全国及31省
5、计算说明:对外开放度=进出口总额/国内生产总值
6、缺失情况:无缺失
7、指标解释:对外开放度是指一个国家或地区经济对外开放的程度,具体表现为市场的开放程度。
1987-2023年各省进出口总额数据整理(含进口和出口)(无缺失)
1987-2023年各省进出口总额数据整理(含进口和出口)(无缺失)
1、时间:1987-2023年
2、来源:各省NJ、统计GB
3、指标:进出口总额(万美元)、进口总额(万美元)、出口总额(万美元)
4、范围:31省市
5、缺失情况:无缺失
1993年地级市民国铁路开通数据(地级市工具变量)
1993年地级市民国铁路开通数据(地级市工具变量-)
1、时间:1933年
2、指标:是否开通铁路
3、来源:来源于《Z国铁道便览》
4、方法说明:参考田坤(2023)通过确定样本城市在1933年是否具有铁路通行条件,将样本城市标记为1或0,其中如果铁路线路经过样本城市,则标记为1,否则标记为0。
5、范围:287个地级市
6、用途:可以用于研究民国时期城市化与铁路交通的关系及不同城市在铁路交通对经济发展的影响上是否具有不同的效应。
2001-2021年各城市平均风速数据(可作工具变量)
2001-2021年各城市平均风速数据(可作工具变量)
1、时间:2001-2021年
2、指标:行政区划代码、年份、地区、所属省份、经度、纬度、平均风速(米/秒)
3、来源:美国国家海洋和大气管理J(NOAA)
4、范围:370个地级市
5、参考文献:
孙伟增,张晓楠,郑思齐.空气污染与劳动力的空间流动——基于流动人口就业选址行为的研究
李丁,张艳,马双,邵帅.大气污染的劳动力区域再配置效应和存量效应
2001-2021年上市公司制造业智能制造年报词频统计数据
2001-2021年上市公司制造业智能制造年报词频统计数据
1、时间:2001-2021年
2、来源:上市公司年报
3、指标:年份、股票代码、行业名称、行业代码、所属省份、所属城市、智能制造词频、智能制造占比(%)
4、范围:上市公司
5、样本量:2.8W+
6、参考文献:郭磊,贺芳兵,李静雯.中国智能制造发展态势分析——基于制造业上市公司年报的文本数据
2000-2022年上市公司数字经济专利申请数据
2000-2022年上市公司数字经济专利申请数据
1、时间:2000-2022年
2、来源:国家知识产权J
3、指标:年份、股票代码、股票简称、行业名称、行业代码、省份、城市、区县、行政区划代码、城市代码、区县代码、首次上市年份、上市状态、数字经济专利申请、其中发明专利申请、其中实用新型专利申请、发明专利占比、实用新型专利占比
4、方法说明:根据专利的主分类号与《数字经济及其核心产业统计分类2021》进行匹配
5、样本量:3.2W+
6、用途:可用于衡量企业数字创新水平
2000-2020年全国各地级市资本存量测算数据(以2000年为基期)(含原始数据+计算过程+结果)
2000-2020年全国各地级市资本存量测算数据(以2000年为基期)(含原始数据+计算过程+结果)
1、时间:2000-2020年
2、来源:城市NJ、各省NJ以及各市的公B
3、指标:固定资产投资总额、固定资产投资价格指数、固定资产投资形成总额
3、范围:283个地级市
4、参考方法:参考张军算法,折旧率为9.6%,基期资本存量的计算是用基期的实际固定资本形成总额除以10%。
本期物质资本存量=上期物质资本存量*(1-9.6%)+本期固定资产形成总额
1996-2022年全国31省ZF干预度数据/财政干预度数据(含原始数据+计算过程+结果)
1996-2022年全国31省ZF干预度数据
1、时间:1996-2022年
2、来源:国家统计J、各省NJ
3、指标:地方财政一般预算支出、地区生产总值(GDP)、ZF干预度
4、范围:31省市
1999-2022年各省研究与试验发展经费内部支出数据/研发经费内部支出数据/R&D经费内部支出数据
1999-2022年各省研究与试验发展经费内部支出数据/研发经费内部支出数据/R&D经费内部支出数据
1、时间:1999-2022年
2、来源:整理自科技nj
3、指标:研究与试验发展经费内部支出/R&D经费内部支出/研发经费内部支出
4、范围:全国、东部地区、西部地区、中部地区及31省
5、缺失情况:无缺失
1999-2022年各省研发人员全时当量/研究与试验发展(R&D)人员全时当量数据.xlsx
1999-2022年各省研究与试验发展人员全时当量数据/省研发人员全时当量数据/(R&D)人员全时当量(无缺失)
1、时间:1999-2022年
2、来源:科技nj
3、指标:研究与试验发展人员全时当量/研发人员全时当量/研究与试验发展(R&D)人员全时当量
4、范围:全国、东部地区、西部地区、中部地区及31省
1999-2023年上市公司员工学历、工资数据.xlsx
1999-2023年上市公司员工学历、工资数据
1、时间:1999-2023年
2、来源:上市公司公告
3、指标:年份、股票代码、股票简称、中文全称、行业名称、行业代码、省份、城市、区县、省份代码、城市代码、区县代码、首次上市年份、上市状态、员工人数_人、男性人数、女性人数、研究生及以上、本科或大专、高中及以下、应付职工薪酬_元、支付给职工以及为职工支付的现金_元、员工薪酬水平_元/人、董监高年薪总额_元、董监高总人数_人、董监高平均年薪_元/人
4、范围:上市公司
【更新至2023年】2000-2023年中国气候政策不确定性指数(全国、省、市三个层面)
【更新至2023年】2000-2023年中国气候政策不确定性指数数据(全国、省、市三个层面)
1.时间:2000-2023年
2.来源:使用人工审计和深度学习算法MacBERT模型,基于中国《人民日报》《光明日报》《经济日报》《环球时报》《科技日报》《中国新闻社》等6家主流报纸中的1,755,826篇文章,构建了2000年1月至2023年12月的中国全国、省份和主要城市层面的CCPU指数。研究框架包括六个部分:数据收集、清洗数据、人工审计、模型构建、指数计算与标准化以及技术验证。
3.范围:中国、省、市三个层次
4.参考文献:Ma, Y. R., Liu, Z., Ma, D., Zhai, P., Guo, K., Zhang, D., & Ji, Q. (2023). A news-based climate policy uncertainty index for China. Scientific Data, 10(1), 881.
5.时间跨度:全国层面:日度、月度、年度;省级层面:月度、年度;地级市层面:月度、年度
2011-2022全国各省金融科技水平数据(根据百度指数构建、含原始数据+处理代码+结果).zip
2011-2022年全国各省金融科技水平(根据百度指数构建含原始数据+处理代码)
1、时间:2011-2022年
2、范围:31省市
3、指标:省份、year、金融科技、互联网金融、Fintech、人工智能、大数据、云计算、区块链、生物识别、移动支付、在线支付、第三方支付、网贷、网络贷款、网上贷款、网上银行、电子银行、互联网银行、直销银行、金科_1、金科_2、金科_3、金科_4、金科_5、金科_6、金科_7、金科_8、常住人口、lnpeople
4、参考文献:
盛天翔、范从来,金融科技、最优银行业市场结构与小微企业信贷供给
【更新至2023年】1987-2023年各省专利申请授权数据
【更新至2023年】1987-2023年各省专利申请授权数据(8个指标)
1、时间:1987-2023年
2、指标:国内专利申请受理量(项)、国内发明专利申请受理量(项)、国内实用新型专利申请受理量(项)、国内外观设计专利申请受理量(项)、国内专利申请授权量(项)、国内发明专利申请授权量(项)、国内实用新型专利申请授权量(项) 、国内外观设计专利申请授权量(项)
3、来源:统计NJ、国家统计J
4、范围:31省
5、缺失情况:1997-2022年31省均无缺失,1997年之前重庆、海南、青海、西藏、宁夏、新疆个别年份存在缺失,其他省份无缺失
2003-2024年高铁线路信息数据
2003-2024年高铁线路信息数据
1、时间:2003-2024年
2、来源:高铁航线数据库(Chinese High-speed Rail and Airline Database,CRAD)
3、指标:高铁线路名称、起点名、终点名、开通时间、线路长度(km)、设计速度(km/h)、沿途主要车站
4、指标说明:
[高铁线路名称]-高铁线路名称
[起点名]-高铁线路的起点站名
[终点名]-高铁线路的终点站名
[开通时间]-高铁线路的开通时间
[线路长度(km)]-高铁线路的总线路长度,单位:km
[设计速度(km/h)]-该高铁线路列车能保持安全顺适行使的最大行使速度,单位:km/h
[沿途主要车站]-高铁线路全程沿途停靠的主要车站
2003-2024年高铁列车信息数据
2003-2024年高铁列车信息数据
1、数据:2003-2024年
2、指标:列车车次、出发站、出发站所属地级市、出发站所属省份、出发站类型、到达站、到达站所属地级市、到达站所属省份、到达站类型、车型、开车时间、到站时间、运行时间、里程
3、来源:高铁航线数据库(Chinese High-speed Rail and Airline Database,CRAD)
4、指标说明:
[列车车次]-发车列车的车次编号
[出发站]-列车的出发站
[出发站所属地级市]-列车的出发站所属地级市
[出发站所属省份]-列车的出发站所属省份
[出发站类型]-列车出发站类型,如:始发车、过路车
[到达站]-列车的到达站
[到达站所属地级市]-列车的到达站所属地级市
[到达站所属省份]-列车的到达站所属省份
[到达站类型]-列车到达站类型,如:始发车、过路车
[车型]-列车的车型分类,如:动车、高铁、特快、普快等
[更新日期]-高铁列车信息更新的日期
[开车时间]-列车从该站台开车出发的时间
[到站时间]-列车到达终点站的时间
[运行时间]-列车在出发站与到达站之间的运行时间
[里程]-列车在出发站与到达站之间的运行里程数,单位:km
2003-2024年飞机航线信息数据
2003-2024年飞机航线信息数据
1、时间:2003-2024年
2、来源:高铁航线数据库(Chinese High-speed Rail and Airline Database,CRAD)
3、指标:起点城市、起点城市所属地级市、起点城市所属省份、起点机场、终点城市、终点城市所属地级市、终点城市所属省份、终点机场、航空公司、更新日期、航班、出发时间、到达时间、准点率、班次_周一、班次_周二、班次_周三、班次_周四、班次_周五、班次_周六、班次_周日
指标说明:
[起点城市]-航班起飞的起点城市
[起点城市所属地级市]-航班起飞的起点城市所属地级市
[起点城市所属省份]-航班起飞的起点城市所属省份
[起点机场]-航班起飞的起点机场
[终点城市]-航班降落的终点城市
[终点城市所属地级市]-航班降落的终点城市所属地级市
[终点城市所属省份]-航班降落的终点城市所属省份
[终点机场]-航班降落的终点机场
[航空公司]-进行该次飞行任务的航班所属的航空公司简称
[更新日期]-飞机航线信息更新的日期
[航班]-该次航线的航班编号
[出发时间]-航班从起点城市的出发时间
[到达时间]-航班降落终点城市的到达时间
[准点率]-航班准点到达的概率情况
[班次_周一]-周一是否有该飞机的航班,是为“1”,否为“0”
[班次_周二]-周二是否有该飞机的航班,是为“1”,否为“0”
[班次_周三]-周三是否有该飞机的航班,是为“1”,否为“0”
[班次_周四]-周四是否有该飞机的航班,是为“1”,否为“0”
[班次_周五]-周五是否有该飞机的航班,是为“1”,否为“0”
[班次_周六]-周六是否有该飞机的航班,是为“1”,否为“0”
[班次_周日]-周日是否有该飞机的航班,是为“1”,否为“0”
2003-2024年高铁开通时间数据
2003-2024年高铁开通时间数据
1、时间:2003-2024年
2、来源:整理自高铁航线数据库(Chinese High-speed Rail and Airline Database,CRAD)
3、指标:高铁站名称、开通时间、所在省份、所在城市、所属线路名称、以及相关备注
4、指标说明:
[高铁站名称]-高铁站名称
[开通时间]-高铁站所属的高铁线路开通时间
[所在省份]-高铁站所在省份
[所在城市]-高铁站所在城市名称
[所属线路名称]-高铁站所属的高铁线路名称
[备注]-该高铁站只办理货运或具体停靠时间与开通时间不同等情况说明
1991-2024年上市公司信息披露质量KV指数数据(含原始数据+计算过程+结果)
1991-2024年上市公司信息披露质量KV指数数据(含原始数据+计算过程+结果)
1、时间:1991-2024年
2、来源:csmar
3、指标:stkcd、year 、证券代码、交易日期、日收盘价、日个股交易股数、日个股交易金额、考虑现金红利再投资的个股日回报率、市场类型、证券简称、上市日期、国家代码、公司全称、公司英文全称、行业代码A、行业名称A、行业代码B、行业名称B、行业代码C、行业名称C、行业代码D、行业名称D、公司成立日期、所属省份、所属省份代码、所属城市、所属城市代码、上市公司经营性质、上市公司经营性质编码、数据库最早交易记录的日期、数据库中交易数据的计量货币、股票发行溢价、发行价格、发行价格的计量货币、发行数量、股票面值的计量货币、发行日期、股票面值、区域码、公司活动情况、AB股交叉码、情况变动日、H股交叉码、市场类型、KV、KV稳健性
4、范围:A股上市公司
6、相关研究:
翟光宇, 武力超, 唐大鹏. Z国上市银行董事会秘书持股降低了信息披露质量吗?——基于2007-2012年季度数据的实证分析
林长泉, 毛新述, 刘凯璇. 董秘性别与信息披露质量——来自沪深A股市场的经验证据
徐寿福, 徐龙炳. 信息披露质量与资本市场估值偏误
1999-2023年上市公司生命周期数据(含原始数据+计算代码+结果)(Dickinson现金流法).zip
1999-2023年上市公司生命周期数据(含原始数据+计算代码+计算结果)(Dickinson现金流法)
1、时间:1999-2023年
2、来源:csmar、上市公司年报
3、指标:stkcd、year、统计截止日期、quarter、证券代码、证券简称、是否发生差错更正、差错更正披露日期、销售商品提供劳务收到的现金、客户存款和同业存放款项净增加额、存放央行和同业款项净减少额、向中央银行借款净增加额、向其他金融机构拆入资金净增加额、收到原保险合同保费取得的现金、收到再保险业务现金净额、保户储金及投资款净增加额、处置交易性金融资产净增加额、收取利息手续费及佣金的现金、拆入资金净增加额、回购业务资金净增加额、拆出资金净减少额、买入返售款项净减少额、收到的税费返还、收到的其他与经营活动有关的现金、经营活动现金流入小计、购买商品接受劳务支付的现金、客户贷款及垫款净增加额、向中央银行借款净减少额、存放中央银行和同业款项净增加额、支付原保险合同赔付款项的现金、支付利息手续费及佣金的现金、支付再保业务现金净额、保户储金及投资款净减少额、拆出资金净增加额、买入返售款项净增加额、拆入资金净减少额、卖出回购款项净减少额、支付保单红利的现金、支付给职工以及为职工支付的现金、支付的各项税费、生命周期1、生命周期2
4、范围:A股上市公司
5、方法:Dickinson现金流法,根据不同现金流符号划分为生命周期的5个阶段,即,导入期、增长期、成熟期、淘汰期及衰退期。
6、参考文献:
DickinsonV..Cash flow patterns as a proxy for firmlife cycle [J ].Working paper Fisher School of Accounting University of Florida 2007
1999-2023年上市公司高新技术资质认定数据
1999-2023年上市公司高新技术资质认定数据
1、时间:1999-2023年
2、来源:Q国高新技术企业认定管理工作领导小组办公室
3、指标:年份、股票代码、股票简称、中文全称、行业名称、行业代码、省份、城市、区县、省份代码、城市代码、区县代码、首次上市年份、上市状态、有过高新技术企业认定、认定次数、初次认定年份、初次公告年份
4、样本量:6.45W+
2000-2023年上市公司绿色专利申请授权面板数据
2000-2023年上市公司绿色专利申请授权面板数据
1、时间:2000-2023年
2、来源:国家知识产权J、WPIO清单
3、指标:年份、股票代码、股票简称、行业名称、行业代码、省份、城市、区县、区县代码、上市状态、绿色专利申请总量、绿色发明专利申请总量、实用新型绿色专利申请总量、绿色专利授权总量、绿色发明专利授权总量、实用新型绿色专利授权总量、绿色发明专利申请占比、实用新型绿色专利申请占比、绿色发明专利授权占比、实用新型绿色专利授权占比、
4、范围:A股上市公司
5、样本量:6W+
2005-2022全国及各省家庭承包耕地流转总面积及经营耕地面积数据(无缺失)
2005-2022全国及各省家庭承包耕地流转总面积及经营耕地面积数据(无缺失)
1、时间:2005-2022年
2、范围:全国及30省,不含西藏
3、指标:家庭承包耕地流转总面积、家庭承包经营耕地面积、土地流转率、
4、来源:农村经营管理统计NB
2007-2023年42家上市商业银行常用变量数据.xls
2007-2023年42家上市商业银行常用变量面板数据
1、时间:2007-2023年
2、来源:银行年报、社会责任报告
3、指标:
基本情况:证券代码、证券简称、公司属性、省份、城市、成立日期、上市日期、上市地点、上市板、
存贷情况:贷款总额、绿色信贷余额、绿色信贷比例、存款总额、贷款减值准备、贷款损失准备充足率、单一最大客户贷款比例、存贷款比率、不良贷款率、不良贷款余额、不良贷款拨备覆盖率、净息差、净利差、资本充足率、成本收入比、资本净额、加权风险资产净额、杠杆率、
流动性比例、流动性覆盖率、
财务指标:总资产、总负债、净资产、资产负债率、权益乘数、营业收入、利息收入、利息净收入、非利息收入、非利息收入占比、手续费及佣金收入、管理费用、净利润、净资产负债率、营业收入同比增长率、销售净利率、总资产净利率、净资产收益率、每股收益、每股营业收入、
公司治理:第一大股东持股比例、独立董事比例、董事长与总经理是否二职合一、
宏观指标:银行业景气指数、省、GDP、增长率、全国、GDP、增长率、货币供应量、M2、增长率、消费者价格指数、CPI、涨跌幅、人民币存款准备金率、上海银行同业拆借利率SHIBOR、
2003-2021年各省农业全要素生产率数据(含原始数据+计算结果)(非期望产出SBM投入导向)
2003-2021年各省农业全要素生产率数据(含原始数据+计算结果)(非期望产出SBM投入导向)
1、时间:2003-2021年
2、来源:统计NJ、各省NJ、农村NJ
3、指标:有效灌溉面积(千公顷)、农药使用量(万吨)、农用塑料薄膜使用量(万吨)、农业机械总动力(万千瓦)、第一产业就业人数(万人)、化肥施用量(折纯)万吨、农用柴油使用量(万吨)、农作物总播种面积(千公顷)、农林牧渔全社会固定资产投资(亿元)、农业总产值(亿元)、农业碳排放(万吨)、Technical Efficiency Score(CRS)、Pure Technical Efficiency Score(VRS)、Scale Effect Score
4、范围:30省
5、方法:非期望产出SBM投入导向
2003-2021年各省农业绿色全要素生产率数据(含原始数据+计算结果)(超效率SBM投入导向VRS)
2003-2021年各省农业绿色全要素生产率数据(含原始数据+计算结果)(超效率SBM投入导向VRS)
1、时间:2003-2021年
2、来源:统计NJ、各省NJ、农村NJ
3、指标:有效灌溉面积(千公顷)、农药使用量(万吨)、农用塑料薄膜使用量(万吨)、农业机械总动力(万千瓦)、第一产业就业人数(万人)、化肥施用量(折纯)万吨、农用柴油使用量(万吨)、农作物总播种面积(千公顷)、农林牧渔全社会固定资产投资(亿元)、农业总产值(亿元)、农业碳排放(万吨)、Technical Efficiency Score(CRS)、Pure Technical Efficiency Score(VRS)、Scale Effect Score
4、范围:30省
5、方法:超效率SBM投入导向VRS
6、参考文献:农产品贸易对农业绿色全要素生产率的空间溢出效应*——基于农业产业集聚的调节作用(杨秀玉)
2004-2023年上市公司战略激进度数据(含原始数据+计算代码+计算结果)
2004-2023年上市公司战略激进度数据(含原始数据+计算代码+计算结果)
1、时间:2004-2023年
2、来源:上市公司NB
3、指标:证券代码、员工人数、固定资产净额、无形资产净额、资产总额、营业收入、销售费用、管理费用、研发投入金额
4、范围:上市公司
5、参考文献:王墨林,阎海峰,宋渊洋.企业数字化程度对战略激进度的影响研究
2001-2023年上市公司管理讨论与分析文本数据(MD&A文本数据)
2001-2023年上市公司管理讨论与分析文本数据(MD&A文本数据)
1、时间:2001-2023年
2、来源:上市公司NB
3、格式:txt
4、样本量:6W+
4、说明:“管理层讨论与分析”(MANAGEMENT DISCUSSION AND ANALYSIS 简称MD&A)是上市公司年报第八节——董事会报告的重要组成部分,要求管理层进一步解释和分析公司当期财务报表及附注中的重要历史信息,并从公司管理层的角度对下一年度的经营计划以及公司未来发展所面临的机遇、挑战和各种风险进行说明。
1999-2023年上市公司微观企业劳动生产率数据(含原始数据+计算代码+计算结果)(两种方法)
1999-2023年上市公司微观企业劳动生产率数据(含原始数据+计算代码+计算结果)(两种方法)
1、时间:1999-2023年
2、来源:上市公司NB
3、指标:股票代码、年份、存货净额、营业收入、员工人数、劳动生产率
4、范围:上市公司
5、计算方法:
方法1:使用企业单位劳动力产出(人均营业收入)的对数值衡量企业劳动生产率
方法2:使用(销售收入+存货变动)与员工人数之比的对数衡量企业劳动生产率
6、参考文献:
牛志伟,许晨曦,武瑛.营商环境优化、人力资本效应与企业劳动生产率
李广众,叶敏健,郑颖.资本结构与员工劳动生产率
1949-2022年各省农作物播种面积数据
1949-2022年各省农作物播种面积数据
1、时间:1949-2022年
2、来源:各省NJ、国家统计J、农业B、农业NJ
3、范围:31省
4、指标:年度标识、省份编码、省份名称、农作物总播种面积、粮食作物播种面积、谷物播种面积、稻谷播种面积、小麦播种面积、玉米播种面积、豆类播种面积、薯类播种面积、油料播种面积、花生播种面积、油菜籽播种面积、棉花播种面积、麻类播种面积、黄红麻播种面积、糖料播种面积、甘蔗播种面积、甜菜播种面积、烟叶播种面积、烤烟播种面积、蔬菜播种面积、茶园面积、果园面积
2005-2022年各省绿色信贷水平测算数据(含原始数据+计算过程+计算结果)
2005-2022年各省绿色信贷水平测算数据(含原始数据+计算过程+计算结果)
1、时间:2005-2022年
2、来源:工业统计NJ、统计NJ、其中2017年采用插值法填补
3、范围:31省
4、方法说明:选取各省六大高耗能产业利息支出占工业产业利息总支出的比率作为反向指标来衡量绿色信贷水平;六大高能耗产业为:化学、石油、电力热力、黑色金属、有色金属、非金属
5、参考文献:谢婷婷,刘锦华.绿色信贷如何影响Z国绿色经济增长?
2002-2024年地级市新质生产力词频统计数据(46个关键词词频)
2002-2024年地级市新质生产力词频统计数据(46个关键词词频)
1、时间:2002-2024年
2、来源:ZF工作报告
3、指标:行政区划代码、年份、地区、所属省份、文本总长度、仅中英文-文本总长度、文本总词频-全模式、文本总词频-精确模式、词频和、新质生产力、人工智能、科技创新、技术革新、科学发展、创新动能、颠覆性技术、突破性技术、革命性创新、新技术、前沿技术、高新技术、尖端技术、新能源、新经济、数字经济、创新经济、未来经济、新业态、数字化转型、产业升级、新模式、战略性新兴产业、未来产业、高科技产业、新动能产业、创新驱动、技术驱动、创新引领、重大突破、提高生产力、质的转变、提升生产力、高效能、高性能、高效率、高产出、高质量发展、质量优先、效益提升、高标准发展、主导技术、创新领先、科技引领、关键突破、核心技术突破
4、范围:286个地级市(含直辖市)
5、方法:利用Python对ZF工作报告进行分词处理,统计了ZF工作报告中与“新质生产力”相关的46个关键词词频
1999-2023年上市公司人工智能词频统计数据(年报词频统计)
1999-2023年上市公司人工智能词频统计数据(年报词频统计)
1、时间:1999-2023年
2、来源:上市公司NB
3、指标:股票代码、公司简称、年报标题、年份、行业名称、行业代码、全文-文本总长度、仅中英文-文本总长度、人工智能水平、人工智能-词频和、人工智能、计算机视觉、图像识别、知识图谱、智能教育、增强现实、智能政务、特征提取、商业智能、智能养老、支持向量机|SVM、知识表示、模式识别、物联网、人机对话、AI产品、人机交互、数据挖掘、智慧银行、智能客服、虚拟现实、自动驾驶、无人驾驶、智慧金融、大数据营销、长短期记忆|LSTM、智能芯片、边缘计算、云计算、深度神经网络、AI芯片、深度学习、特征识别、智能保险、智能零售、智能医疗、智能运输、智能家居、循环神经网络、大数据风控、机器人流程自动化、可穿戴产品、大数据平台、增强智能、大数据运营、机器翻译、神经网络、语音合成、人机协同、智能农业、智能音箱、卷积神经网络、问答系统、强化学习、大数据分析、自然语言处理、大数据管理、智能计算、语音交互、机器学习、生物识别、语音识别、智能监管、智能投顾、智能语音、声纹识别、人脸识别、智能体、大数据处理、分布式计算、智能传感器、智能搜索、智能环保
4、范围:A股上市公司
5、参考文献:人工智能如何提升企业生产效率?——基于劳动力技能结构调整的视角(姚加权)
2010-2023年各地级市金融科技公司注册数量数据
2010-2023年各地级市金融科技公司注册数量数据
1.时间:2010-2023年
2.来源:天眼查
3.指标:年份、省份、地级市、行政区划代码、当年新注册金融科技公司数量、累计注册金融科技公司数量
4.范围:300+地级市
5.方法说明:首先在“天眼查”网站检索“金融科技”“云计算”“大数据”“区块链”“人工智能“物联网”等关键词,以获取所有相关公司的工商注册信息。 为了避免检索中出现的巧合字符匹配,只保留公司名称或经营范围中出现以上关键词的样本。 对数据做了进一步筛选: 根据样本中金融科技公司的经营范围以及巴塞尔银行监督委员会对金融科技业务模式的分类,使用正则表达式对 “金融”“保险”“信贷”“清算”“支付”等与金融相关的关键词公司经营范围中进行模糊匹配,并保留匹配成功的样本。 除此之外,考虑到经营范围中存在“不得从事……业务”“严禁涉及……业务”“以上除……业务”等字段,在筛选之前对这些字段进行了删除。 最终,统计地级市每年的金融科技公司数量,并以此测度地区金融科技发展水平,数值越大代表金融科技发展水平越高。
6.参考文献:宋敏,周鹏,司海涛.金融科技与企业全要素生产率——“赋能”和信贷配给的视角
7、用途:可用于衡量地级市金融科技发展水平