数据分析笔记:广州市财政收入挖掘预测案例

通过对广州市1999年至2013年的财政收入数据进行分析,本案例运用Adaptive-lasso方法筛选关键指标,包括城镇非私营单位从业人员数量、城镇单位职工年平均工资等,进行特征选择。接着,采用灰色预测模型预测2014-2015年地方财政收入、增值税、营业税、企业所得税和个人所得税。此外,还利用BP神经网络模型对预测数据进行验证,为广州市的财政预算提供科学依据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1、背景

在我国现行的分税制财政管理体制下,地方财政收入不仅是国家财政收入的重要组成部分,而且具有其相对独立的构成内容。地方财政收入是区域国民经济的综合反映,也是市场经济国家的政府进行宏观调控的基础。科学、合理地预测地方财政收人,对于克服年度地方预算收支规模确定的随意性和盲目性,正确处理地方财政与经济的相互关系具有十分重要的意义。

广州市作为广东省的省会,改革开放的前沿城市,交通便利,拥有中国大陆三大国际航空枢纽机场之一的广州白云国际机场和中国第三大港口、港口货物吞吐量居世界港口第五位的广州港。广州号称千年商埠,历史上一直是中国最重要的商业中心之一,商业网点多、行业齐全、辐射面广、信息灵、流通渠道通顺,拥有商业网点10万多个,为中国十大城市之冠。广州市在实现经济快速发展,地区生产总值飞跃的同时,也意味着财政收入的增收。2013年,广州实现地区生产总值(GDP)15420.14亿元,增长11.6%。其中,第一产业增加值228.87亿元,增长2.7 %;第二产业增加值5227.38亿元,增长9.2%;第三产业增加值9963.89亿元,增长13.3%。第一、二、三产业增加值的比例为1.48∶33.90∶64.62。三次产业对经济增长的贡献率分别为0.4%、29.0%和70.6%。广州地方公共财政预算收入1141.79亿元,增长10.8%;如何做出下一年有效的财政收入预算,为下一年的政策提供指导依据,是一个具有重大意义的问题。

2、需求

要求:根据广州市1999年-2013年财政收入数据,预测广州市2014-2015年份的地方财政收入、增值税、营业税、企业所得税、个人所得税、政府性基金收入等数据。并给出相关建议。

 

 

 

 

 

 3、分析思路

数据分析思路:

首先,阅读、理解以及整理收集到的数据,根据经济指标提炼数据,接着通过Adaptive_lasso方法进行特征选择,得到满足条件的特征变量;

其次,使用灰色预测对财政收入、增值税、营业税、企业所得税、个人所得税、政府性基金收入的影响因素2014-2015年数据进行预测,得到各影响因素2014-2015年数据。

再次,使用特征变量1999年-2015年数据,训练神经网络模型,再使用训练的模型预测2014-2015年广州市财政收入及各个类别收入数据;

最后,根据预测的数据,给广州财政局提出了几点合理的财政建议。

 4、Adaptive-lasso指标筛选

Adaptive_lasso算法是近些年来被广泛应用于参数估计于变量选择的方法之一。Adaptive_Lasso算法能够解决最小二乘法和逐步回归局部最优解的不足,这是他的优点之一。Adaptive_lasso算法计算出某变量的特征值非零,则表示该变量对预测变量存在较大影响,而如果某变量的特征值为零,则表示该变量对预测变量影响很小。

4.1 地方财政收入影响元素指标筛选

1)指标初步筛选

从1999年-2013年财政收入表数据中可以发现,地方财政收入组成主要包括:1、税收收入,主要包括企业所得税和地方所得税中中央和地方共享的40%,地方享有的25%的增值税、营业税、印花税等;2、非税收入,包括专项收入、行政事业性收费、罚没收入、国有资本经营收入和其他收入等。政府性基金收入是国家通过向社会征收以及出让土地、发行彩票等方式取得收入,并专项用于支持特定基础设施建设和社会事业发展的收入。地方财政收入组成如图7:

 

地方财政收入影响因素有很多,本文基于案例给予的数据,参考相关文献,以及对经济理论对财政收入的解释,最终我们初步确定了以下影响财政收入的因素:

X1城镇非私营单位从业人员数量:地区就业人数的上升,会引起地区人民收入总量的上升,从而间接影响财政收入的增加。

X2城镇单位职工年平均工资:城镇单位职工年平均工资能反映该地区的平均收入水平,并且职工收入增加,会引起地方财政的个人所得税总量的增加,从而影响财政收入的增加。

X3城镇人均可支配收入:城镇居民的可支配收入能反映他们的潜在消费能力,可支配收入越高,消费水平越高,从而会影响该地区的营业总额增加;而营业总额的增加,地方财政会获得更多的营业税收收入,从而促使财政收入的增长。

X4城镇居民储蓄存款余额:城镇居民储蓄存款余额能反映城镇居民的收入水平,储蓄水平高,收入也高,进而影响地方财政的个人税收收入。因此,城镇居民储蓄存在余额也是

影响财政收入的因素之一。

X5全社会固定资产投资额:是固定资产再生产活动,其内容包含建造和购置固定资产的经济活动。固定资产的投资能促进经济增长,扩大税源,进而拉动财政税收收入整体增长。

X6地区生产总值:表示地方经济发展水平。通常而言,政府财政收入来源于即期的地区生产总值。在国家经济政策不变、社会秩序稳定的情况下,地方经济发展水平与地方财政收入之间存在着密切的相关性,越是经济发达的地区,其财政收入的规模就越大。

X7第一产业增值:第一产业包括农业(包括种植业、林业、牧业和渔业)。广东市在2005年取消了农业税,因而第一产业对财政收入的影响会较小。

X8第三产业与第二产业产值比:表示产业结构。三个产业生产总值代表国民经济水平,而生产总值是财政收入的主要影响因素,当产业结构逐步优化时,财政收入也会随之增加。

X9总税收:税收收入往往是地方财政收入的主要来源之一,其具有征收的强制性、无偿性和固定性特点,可以为政府履行其职能提供充足的资金来源。因此,总税收的变化会极大的影响地方财政收入。

X10工业增值:工业产值增值一定程度上能反映该地区的生产总值的增值情况,而生产总值的增长是影响地方财政收入的主要因素之一。

2)pearson相关系数

相关性分析主要用来检测目标变量与描述变量之间相关性分析,按照相关性可以分为正相关、负相关以及不相关,本文中的财政收入预测属于基于历史信息的线性正相关分析预测,因此,与财政收入相关的变量必须与其呈正相关关系,否则不采用该变量构建模型。财政收入与变量的Pearson相关性分析结果如表1所示:

从Pearson相关系数表中可以看出,本文选取的10个变量均与财政收入呈较高的正相关性,并且与财政收入呈显著相关性。因此,这些变量均满足要求,可以用于构建模型,进行预测。

3)lasso特征选择

本文选择Lasso算法解决Adaptive-lasso估计,确定特征变量。Lasso算法能够对变量进行筛选去重,可以将存在线性关系的变量进行去重。这也是本文选择该算法进行特征选择的原因之一。

特征选择结果如下:

 

从表3中可以看出,X2,X8的特征值结果为0,即这两个变量可能与其它变量存在共线关系,因而Adaptive-lasso将这两个变量剔除了。从实际角度考虑第一产业增值与第二/第三产业增值的比值很可能存在线性关系,城镇单位人均工资水平也与城镇居民人均可支配收入存在线性关系。特征选择的结果说明Adaptive-Lasso方法在构建模型时,能够剔除存在共线性关系的变量,同时体现了Adaptive-Lasso方法对多指标进行建模的优势。

4.2 营业税收入指标筛选

1)初步筛选

通过Adaptive-lasso算法确定的营业税影响因素。公路客运量(x1)、建筑业增加值(x2)、第三产业增加值(x3)、全社会房地产开发投资额(x4)、  全社会住宅投资额(x5)、地方财政收入(x6)、建筑业总产值(x7)、住宿和餐饮业零售额(x8)、限额以上餐饮业主营业务收入(x9)这些指标都可能与营业税收入存在关系。因此初步选择这些指标作为lasso输入变量。

2)pearson相关系数

对初步筛选的指标与营业税收入的相关性进行计算,结果如下表所示:

  从营业税相关系数表看,影响营业税的各个数据指标都与营业税呈显著相关性,并且各个数据指标皆与营业税收入呈正相关。

3)lasso特征选择

 将影响营业税收收入的x1-x9数据指标输入lasso特征选择,输出如下结果:

 从上图特征选择结果看。x1-x9各个数据指标皆通过特征筛选。

4.3 增值税收入指标筛选

1)初步筛选

初步筛选出影响增值税的六个数据指标:商品进口总值(x1),地区生产总值(x2)、工业增加值(x3),批发零售业零售额(4)、

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值