1970-2023年各省、市、县、乡镇二氧化碳排放量数据/碳排放数据(省、市、县、乡镇)
1970-2023年各省、市、县、乡镇二氧化碳排放量数据/碳排放数据(省、市、县、乡镇)
1、时间:1970-2023年
2、来源:EDGAR_2024_GHG of October 2024(根据EDGAR提取的所得)
3、指标:省、省代码、市、市代码、镇、乡镇代码、年份、CO2排放量_吨
4、范围:34省市、370个地级市、2800+区县、43365个乡镇
1970-2023年各乡镇二氧化碳排放量数据/乡镇CO2排放量数据
1970-2023年各乡镇二氧化碳排放量数据/乡镇CO2排放量数据
1、时间:1970-2023年
2、来源:EDGAR_2024_GHG of October 2024(根据EDGAR提取的所得)
3、指标:乡镇、乡镇代码、年份、CO2排放量_吨
4、范围:43365个乡镇
1970-2023年各区县二氧化碳排放量数据/区县CO2排放量数据
1970-2023年各区县二氧化碳排放量数据/区县CO2排放量数据
1、时间:1970-2023年
2、来源:EDGAR_2024_GHG of October 2024(根据EDGAR提取的所得)
3、指标:省、省代码、市、市代码、县、县代码、年份、CO2排放量_吨
4、范围:2800+区县
1970-2023年各省市二氧化碳排放量数据/省CO2排放量数据
1970-2023年各省市二氧化碳排放量数据/省CO2排放量数据
1、时间:1970-2023年
2、来源:EDGAR_2024_GHG of October 2024(根据EDGAR提取的所得)
3、指标:省、省代码、年份、CO2排放量_吨
4、范围:34省市
各地级市儒家学校、学堂、孔庙数据
各地级市儒家学校、学堂、孔庙数据
1、来源:儒家学校、书院以儒家学校、书院以及孔庙的数据主要来自于《大明一统志》、《大清一统志》以及明清时期的地方志717
2、指标:省份、城市、学校数量、书院数量、孔庙数量、总量
3、范围:290个地级市
4、用途:可以用于研究儒家文化,也可作为地级市工具变量
5、时间:明清时期
6、相关研究:李万利,徐细雄,陈西婵.儒家文化与企业现金持有——Z国企业“高持现”的文化内因及经济后果
徐细雄,李万利.儒家传统与企业创新:文化的力量
2006-2023年各省研发投入强度数据/研究与试验发展(R&D)经费投入强度数据(无缺失)
2006-2023年各省研发投入强度数据/研究与试验发展(R&D)经费投入强度数据(无缺失)
1、时间:2006-2023年
2、范围:31省
3、来源:科技nj
4、指标:研发投入强度/研究与试验发展(R&D)经费投入强度
1999-2023年各省研究与试验发展经费内部支出数据/研发经费内部支出数据/R&D经费内部支出数据
1999-2023年各省研究与试验发展经费内部支出数据/研发经费内部支出数据/R&D经费内部支出数据
1、时间:1999-2023年
2、来源:整理自科技NJ
3、指标:研究与试验发展经费内部支出/R&D经费内部支出/研发经费内部支出
4、范围:全国、东部地区、西部地区、中部地区及31省
5、缺失情况:无缺失
1999-2023年各省研究与试验发展人员全时当量数据/省研发人员全时当量数据/(R&D)人员全时当量(无缺失)
1999-2023年各省研究与试验发展人员全时当量数据/省研发人员全时当量数据/(R&D)人员全时当量(无缺失)
1、时间:1999-2023年
2、来源:科技NJ
3、指标:研究与试验发展人员全时当量/研发人员全时当量
4、范围:全国、东部地区、西部地区、中部地区及31省
5、缺失情况:无缺失
2004-2023年各省化学需氧量排放量数据(无缺失)
2004-2023年各省化学需氧量排放量数据(无缺失)
1、2004-2023年
2、范围:31省
3、指标:化学需氧量排放量
4、来源:各省NJ、国家统计J、环境NJ
2002-2023年各省老年人口抚养比(人口抽样调查)数据
2002-2023年各省老年人口抚养比(人口抽样调查)数据
1、时间:2002-2023年
2、指标:老年人口抚养比
3、来源:国家统计J、统计NJ
4、范围:31省,
5、缺失情况:无缺失,其中2010年的值取2009、2011年两年均值进行填补
2002-2023年各省人口总抚养比数据(人口抽样调查)
2002-2023年各省人口总抚养比数据(人口抽样调查)
1、时间:2002-2023年
2、指标:总抚养比
3、来源:国家统计J、统计NJ
4、范围:31省,
5、缺失情况:无缺失,其中2010年的值取2009、2011年两年均值进行填补
2002-2023年各省少年儿童抚养比(人口抽样调查)数据
2002-2023年各省少年儿童抚养比(人口抽样调查)数据
1、时间:2002-2023年
2、指标:少年儿童抚养比
3、来源:国家统计J、统计NJ
4、范围:31省,
5、缺失情况:无缺失,其中2010年的值取2009、2011年两年均值进行填补
2001-2023年各省分性别平均受教育年限数据(含原始数据+计算过程+结果).xlsx
2001-2023年各省分性别平均受教育年限数据(含原始数据+计算过程+结果)
1、时间:2001-2023年
2、来源:人口和就业NJ、统计NJ
3、指标:6岁以上人口、未上过学、小学、初中、高中、大专及以上、男性平均受教育年、女性平均受教育年限
4、范围:31省
5、计算说明:平均受教育年限=(未上学人数*0+小学人数*6+初中人数*9+高中人数*12+大专及以上人数*16)/6岁以上人口数
【更新至2024年】2000-2024年各省专利侵权案件结案数数据
2000-2024年各省专利侵权案件结案数数据
1、时间:2000-2024年
2、来源:国家知识产权J
3、指标:专利侵权案件结案数
4、范围:31省
5、用途:可用于衡量知识产权保护水平
2007-2023年各省环保支出占比数据(含原始数据+计算过程+结果)
2007-2023年各省环保支出占比数据(含原始数据+计算过程+结果)
1、时间:2007-2023年
2、来源:整理自国家统计J和统计NJ
3、范围:31省
4、指标:财政环境保护支出、财政一般预算支出、环保支出占比
5、计算公式:环保支出占比=财政环境保护支出/财政一般预算支出
6、缺失情况:无缺失
2007-2023年各省环保支出数据(无缺失)
2007-2023年各省环保支出数据(无缺失)
1、时间:2007-2021年
2、来源:整理自国家统计J和统计NJ
3、指标:财政环境保护支出
4、缺失情况:无缺失
2000-2023年全国各省农村平均受教育年限数据(含原始数据+计算过程+结果)
2000-2023年全国各省农村平均受教育年限数据(含原始数据+计算过程+结果)
1、时间:2000-2023年
2、范围:全国及31省
3、来源:人口与就业统计NJ
4、指标包括:农村平均受教育年限、农村6岁以上总人口、农村未上过学、农村小学、农村初中、农村高中、农村大专及以上人数
5、计算公式: 平均受教育年限=(小学学历人数*6+初中学历人数*9+高中和中专学历人数*12+大专以上学历人数*15)/ 6岁以上人口总数。
6、用途:农村平均受教育年限可以用于比较城乡差异
2000-2022年各地级市进出口总额/地级市对外经济贸易数据
2000-2022年各地级市进出口总额/地级市对外经济贸易数据
1、时间:2000-2022年
2、指标:进出口总额
3、单位:万美元
4、来源:城市NJ、各省NJ、城市GB、2021、2022年为城市统计NJ中进口额出口额加总之后换算成万美元
5、范围:300+地级市
2000-2023年全国各省城镇平均受教育年限数据(含原始数据+计算过程+结果)
2000-2023年全国各省城镇平均受教育年限数据(含原始数据+计算过程+结果)
1、时间:2000-2023年
2、范围:全国及31省
3、来源:人口与就业统计NJ
4、指标包括:城镇平均受教育年限、城镇6岁以上总人口、城镇未上过学、城镇小学、城镇初中、城镇高中、城镇大专及以上人数
5、计算公式: 平均受教育年限=(小学学历人数*6+初中学历人数*9+高中和中专学历人数*12+大专以上学历人数*15)/ 6岁以上人口总数。
6、用途:城镇平均受教育年限,可以用于比较城乡差异
2000-2023年全国各省城乡平均受教育年限数据(分城镇和农村)(含原始数据+计算过程+结果)
2000-2023年全国各省城乡平均受教育年限数据(分城镇和农村)(含原始数据+计算过程+结果)
1、时间:2000-2023年
2、范围:全国及31省
3、来源:人口与就业统计NJ
4、指标包括:城乡平均受教育年限 、6岁以上总人口、未上过学、小学、初中、高中、大专及以上人数,含原始数据、计算过程及计算结果
5、计算公式: 平均受教育年限=(小学学历人数*6+初中学历人数*9+高中和中专学历人数*12+大专以上学历人数*15)/ 6岁以上人口总数。
6、用途:分城镇和农村平均受教育年限,可以用于比较城乡差异
2000-2024年上市公司财务困境MertonDD模型数据(含原始数据+结果)
2000-2024年上市公司财务困境MertonDD模型数据(含原始数据+结果)
1、时间:2000-2024年
2、来源:上市公司NB
3、指标:证券代码、证券简称、统计截止日期、是否发生ST或*ST或PT、是否发生暂停上市、行业代码、行业名称、上市日期、债务市值(元)、权益市值(元)、公司市值1(元)、公司市值2(元)、预期资产收益率、权益价值波动性、债务波动性、资产价值波动性1、资产价值波动性2、当年实际交易天数(天)、DD_Bhsh、DD_merton、DD_KMV
4、范围:A股上市公司
5、数据处理:剔除存在变量缺失的上市公司;对所有连续变量按1% 和99% 水平进行缩尾处理。
6、计算方法:附在文件内
2000-2024年上市公司财务困境RLPM模型数据(含原始数据+结果)
2000-2024年上市公司财务困境RLPM模型数据(含原始数据+结果)
1、时间:2000-2024年
2、来源:上市公司NB
3、指标:证券代码、证券简称、统计截止日期、是否剔除ST或*ST或PT股、是否剔除上市不满一年、已经退市或被暂停上市的公司、行业代码、行业名称、行业代码1、行业名称1、上市日期、总资产净利润率、行业总资产净利润率均值、下行风险、是否剔除北交所上市公司
4、范围:A股上市公司
5、样本量:31W+
6、数据处理:行业分类按照2012版证监会行业分类,制造业"C"字头代码取2位,其他行业取1位,进行行业分类;剔除数据缺失的样本数据、剔除行业分类后样本数少于10个的样本分组;分年度对连续变量进行1%和99%分位上进行winsorize处理
2000-2024年上市公司融资约束指数数据(SA指数、KZ指数、FC指数、WW指数)(含原始数据+计算结果)
2000-2024年上市公司融资约束指数数据(SA指数、KZ指数、FC指数、WW指数)(含原始数据+计算结果)
1、时间:2000-2024年
2、来源:上市公司NB
3、指标:
SA指数:证券代码、证券简称、统计截止日期、是否发生ST或*ST或PT、是否发生暂停上市、行业代码、行业名称、上市日期、总资产、企业经营年度、SA指数
FC指数:证券代码、证券简称、统计截止日期、是否剔除ST或*ST或PT股、是否剔除上市不满一年、已经退市或被暂停上市的公司、是否剔除北交所上市公司、上市日期、行业代码、行业名称、行业代码1、行业名称1、公司年龄(年)、总资产(元)、资产负债率、市账比、净营运资本(元)、息税前利润(元)、现金股利(元)、现金股利支付率、FC指数
KZ指数:证券代码、证券简称、统计截止日期、是否剔除ST或*ST或PT股、是否剔除上市不满一年、已经退市或被暂停上市的公司、是否剔除北交所上市公司、上市日期、行业代码、行业名称、行业代码1、行业名称1、经营性净现金流(元)、现金股利(元)、现金持有(元)、资产负债率、托宾Q值、KZ指数
WW指数:证券代码、证券简称、统计截止日期、是否发生ST或*ST或PT、是否发生暂停上市、行业代码、行业名称、行业代码1、行业名称1、上市日期、总资产(元)、经营性净现金流(元)、是否支付现金股利、长期负债(元)、行业销售收入增长率、销售收入增长率、WW指数
4、范围:A股上市公司
5、计算说明:附在文件内
2000-2024年上市公司财务困境ZScore模型数据(含原始数据+结果)
2000-2024年上市公司财务困境ZScore模型数据(含原始数据+结果)
1、时间:2000-2024年
2、来源:上市公司NB
3、指标:证券代码、证券简称、统计截止日期、是否发生ST或*ST或PT、是否发生暂停上市、行业代码、行业名称、行业代码1、行业名称1、上市日期、总资产(元)、营运资金(元)、留存收益(元)、权益市值(元)、总负债(元)、营业收入(元)、息税前利润(元)、Z值
4、范围:A股上市公司,样本量:6.7W+
5、计算方法:Z = 1.2X1 + 1.4X2+ 3.3X3 + 0.6X4 + 0.999 X5
其中:
X1=营运资金/总资产;反映资产的变现能力和规模特征。
X2=留存收益/总资产;反映公司的累积盈利能力。
X3 = EBIT/总资产;反映资产的盈利能力。
X4=权益的市场价值/总负债的账面价值;是衡量一家公司财务结构、表明所有者权益和债权人权益相对关系的比率,可以反映一家公司的偿债能力。
Xs5=营业收入/总资产;反映企业资产周转情况,用来衡量公司利用资产的效率情况。
6、参考文献:
Edward I. Altman. Financial Ratios, Discriminant Analysis and the Predic口on of Corporate Bankruptcy [J]. The Journal of Finance, 1968;
Isabel Abinzano, Ana Gonzalez-Urteaga, et al. Performance of default-risk measures: the sample matters [J]. Journal of Banking & Finance;
2000-2024年上市公司财务困境OScore模型数据(含原始数据+结果)
2000-2024年上市公司财务困境OScore模型数据(含原始数据+结果)
1、时间2000-2024年
2、指标:证券代码、证券简称、统计截止日期、是否发生ST或*ST或PT、是否发生暂停上市、行业代码、行业名称、行业代码1、行业名称1、上市日期、总资产(元)、流动资产(元)、流动负债(元)、营运资金(元)、留存收益(元)、净利润(元)、总负债(元)、经营性净现金流(元)、O-Score、风险系数
3、范围:A股上市公司,样本量6.7W+
4、来源:上市公司NB
5、参考文献:
James A. Ohlson. Financial Ratios and the Probabilistic Prediction of Bankruptcy [J].Journal of Accounting Research,1980:109-131
2000-2023年上市公司融资约束指数FC指数(含原始数据+计算结果)
2000-2023年上市公司融资约束指数FC指数(含原始数据+计算结果)
1、时间:2000-2023年
2、来源:上市公司NB、csmar
3、指标:证券代码、证券简称、统计截止日期、是否剔除ST或*ST或PT股、是否剔除上市不满一年、已经退市或被暂停上市的公司、是否剔除北交所上市公司、上市日期、行业代码、行业名称、公司年龄(年)、总资产(元)、资产负债率、市账比、净营运资本(元)、息税前利润(元)、现金股利(元)、现金股利支付率、FC指数
4、范围:A股上市公司
5、样本数据处理:剔除数据缺失的样本数据,剔除金融行业公司代码;分年度对连续变量
进行 1%和 99%分位上进行 winsorize 处理。
2000-2024年上市公司融资约束KZ指数数据(含原始数据+结果).xlsx
2000-2024年上市公司融资约束KZ指数数据(含原始数据+计算结果)
1、时间:2000-2024年
2、来源:csmar、上市公司NB
3、范围:A股上市公司
4、指标:证券代码、证券简称、统计截止日期、是否剔除ST或*ST或PT股、是否剔除上市不满一年、已经退市或被暂停上市的公司、是否剔除北交所上市公司、上市日期、行业代码、行业名称、行业代码1、行业名称1、经营性净现金流(元)、现金股利(元)、现金持有(元)、资产负债率、托宾Q值、KZ指数
5、数据处理:选择沪深上市公司,剔除金融行业公司代码、剔除数据缺失的样本数据;分年度对连续变量进行1%和99%分位上进行winsorize 处理。
KZ 指数越大,意味着上市公司面临的融资约束程度高。
2001-2023年各地级市人均地区生产总值数据、人均GDP(全市)
2001-2023年各地级市人均地区生产总值数据、人均GDP(全市)
1、时间:2001-2023年
2、指标:人均地区生产总值/人均GDP
3、范围:299个地级市,全市层面数据
4、来源:城市统计nj
5、缺失情况:缺失情况与nj一致,表内附有年鉴国内生产总值原始数据,以2022年地级市名单进行统计整理,2017年年鉴未统计全市层面数据,为市辖区数据
2000-2024年上市公司财务指标数据
2000-2024年上市公司财务指标数据
1、时间:2000-2024年
2、来源:csmar、上市公司年B
3、指标:证券代码、证券简称、统计截止日期、报表类型、行业代码、行业名称、行业代码1、行业名称1、总资产、总负债、营业收入、经营性净现金流、总资产净利润率、资产负债率、金融负债、经营负债、账面市值比、管理费用率、有形资产比率、流动比率、存货周转率、营运资金周转率、现金及现金等价物周转率、营业收入增长率、非债务税盾、所得税率、盈利波动性、现金流波动性、利息覆盖率、税负、银行借款比例、短期借款依赖度、大股东占款
4、范围:A股上市公司
2002-2023年上市公司生命周期数据(综合得分法)(含原始数据+计算代码+结果)
2002-2023年上市公司生命周期数据(综合得分法)(含原始数据+计算代码+结果)
1、时间:2002-2023年
2、来源:csmar、上市公司年B
3、指标:证券代码、统计截止日期、总资产、负债合计、流动负债合计、短期借款、一年到期长期负债、长期负债、长期借款、应付债券、股东权益合计、主营业务利润、税前总利润、实际所得税、净利润、债务利息支出、经营活动产生的现金流量净额、流动比率、存货周转率、长期负债比率、资产收益率、资产收益率、资产收益率、净资产收益率、净资产收益率、净资产收益率、每股收益、主营收入增长率、息税前盈余、流动资产比率、应计总利息比率、企业平均含息负债、期初含息负债、期末含息负债、资本支出、企业生命周期1、企业生命周期2
4、范围:A股上市公司
5、计算说明:采用销售收入增长率、存留收益率、资本支出率、公司年龄四个变量的得分情况衡量公司生命周期。具体做法是:分行业分别对四个指标排序打分并算出综合得分;然后,根据综合得分按行业由大到小排序,得分最高的约1/4为成长期企业,得分最低的约1/4为衰退期企业,中间1/2为成熟期企业,定义连续变量公司生命周期(Lifec),成长期取1,成熟期取2,衰退期取3;定义虚拟变量成熟期(Lifec2),如果公司处于成熟期取1,否则取0;定义虚拟变量衰退期(Lifec3),如果公司处于衰退期取1,否则取0。
6、参考文献:梁上坤,张宇,王彦超.内部薪酬差距与公司价值——基于生命周期理论的新探索
1998-2023年各地级市国内生产总值、地级市GDP数据(市辖区)
1998-2023年各地级市国内生产总值、地级市GDP数据(市辖区)
1、时间:1998-2023年
2、指标:地区生产总值
3、来源:城市统计NJ
4、范围:299个地级市
5、缺失情况:缺失情况与年鉴一致,表内附有年鉴国内生产总值原始数据,以2022年地级市名单进行统计整理,为市辖区数据
2006-2023年上市公司董事网络位置关系数据
2006-2023年上市公司董事网络位置关系数据
1、时间:2006-2023年
2、来源:cnrds、上市公司年B
3、指标:股票代码、会计年度、董事编码、董事名称、是否独立董事、程度中心度、接近中心度、中介中心度、结构洞
4、范围:上市公司
5、参考文献:董事网络位置与企业金融资产投资效率(林钟高)
1985-2023年全国及各省就业人数数据(无缺失)
1985-2023年全国及各省就业人数数据(无缺失)
1、时间:1985-2023年
2、来源:Z国统计年鉴、各省年鉴、新Z国60年
3、指标:就业人数
4、范围:全国及31省
5、缺失情况:无缺失
2000-2023年各地级市进出口总额/地级市对外经济贸易数据
2000-2023年各地级市进出口总额/地级市对外经济贸易数据
1、时间:2000-2023年
2、指标:进出口总额
3、单位:万美元
4、来源:城市NJ、各省NJ、城市公B、2021、2022、2023年为城市统计年鉴中进口额出口额加总之后换算成万美元
5、范围:300+地级市
6、用途:可用于衡量地级市对外开放度数据
1998-2023年各地级市地区生产总值、地级市GDP数据(全市)
1998-2023年各地级市地区生产总值、地级市GDP数据(全市)
1、时间:1998-2023年
2、指标:地区生产总值
3、来源:城市统计NJ
4、范围:299个地级市
5、缺失情况:缺失情况与年鉴一致,表内附有年鉴国内生产总值原始数据,以2022年地级市名单进行统计整理,2017年年鉴未统计全市层面数据,为市辖区数据
2000-2024年上市公司融资约束WW指数数据(含原始数据+结果).xlsx
2000-2024年上市公司融资约束WW指数(含原始数据+计算结果)
1、时间:2000-2024年
2、来源:上市公司年B
3、指标:证券代码、证券简称、统计截止日期、是否发生ST或*ST或PT、是否发生暂停上市、行业代码、行业名称、行业代码1、行业名称1、上市日期、总资产(元)、经营性净现金流(元)、是否支付现金股利、长期负债(元)、行业销售收入增长率、销售收入增长率、WW指数
4、范围:A股上市公司
2000-2024年上市公司融资约束SA指数数据(含原始数据+计算结果)
2000-2024年上市公司融资约束SA指数数据(含原始数据+计算结果)
1、时间:2000-2024年
2、来源:整理自csmar、上市公司NB
3、指标:证券代码、证券简称、统计截止日期、是否发生ST或*ST或PT、是否发生暂停上市、行业代码、行业名称、上市日期、总资产、企业经营年度、SA指数
4、范围:A股上市公司
5、计算说明:
Hadlock C J,Pierce J R.New Evidence on Measuring Financial Constraints : Moving Beyond the KZ Index [J]. Review of Financial Studies,2010,23(5):1909-1940.
鞠晓生,卢荻,虞义华.融资约束、营运资本管理与企业创新可持续性[J].经济研究,2013(01):5-17.计算公式:SA=-0.737*Size+0.043*Size2-0.040*age
指标说明:Size:企业总资产规模的自然对数;
Age:企业经营年度=观测年度(当前统计截止日期)-企业成立时间(年度)任何一个指标为空,计算结果为空。
区县与地级市和省会的距离
区县与地级市和省会的距离
1、指标:县域代码、县域名称、所属地级市、所属省会城市、所属省/直辖市、与所属地级市距离、与所属省会城市距离、与所属直辖市距离
2、来源:高德地图
3、计算公式:
地球半径R=6371KM,
pi=3.14
Distance=RArccos(C)C=sin(LatAPi180)sin(LatBPi180)+cos(LatAPi180)cos(LatBPi180)cos(LonAPi180-LonBPi180)
4、说明:通过高德地图获取到各个地级市及区县的坐标及省会中心坐标,通过这些指导坐标点进行计算,计算得出各地级市、各区县距离省会的距离。
全国各地区经纬度数据(包含省、市、县)
全国各地区经纬度数据(包含省、市、县)
1、指标:行政区划代码、省份、城市、经度、纬度
2、来源:高德地图
3、用途:可用于空间相关研究
2005-2023年各省恩格尔系数数据(含原始数据+计算过程+计算结果)
2005-2023年各省恩格尔系数数据(含原始数据+计算过程+计算结果)
1、时间:2005-2023年
2、来源:统计NJ、住户调查NJ、国家统计J
3、范围:31省
4、指标:食品消费支出(2013-2023)、居民人均消费支出(2013-2023)、城镇居民人均消费支出(2005-2012)、城镇居民食品消费支出(2005-2012)、农村居民人均消费支出(2005-2012)、农村居民食品消费支出(2005-2012)、总人口(2005-2012)、城镇常住人口数(2005-2012)、农村常住人口数(2005-2012)、城镇恩格尔系数(2005-2012)、农村恩格尔系数(2005-2012)、恩格尔系数(2005-2023)
5、计算说明:
恩格尔系数=居民人均食品性消费支出/居民人均消费支出*100%
其中2005-2012年的恩格尔系数=(农村恩格尔系数*乡村人口占比+城镇恩格尔系数*城镇人口占比)
6、缺失情况:无缺失