基于国会演讲的政党凝聚力分析与结构损伤检测的元启发式算法研究
在政治和工程领域,都存在着一些关键问题需要深入研究和解决。在政治方面,了解政党凝聚力对于民主的发展至关重要;在工程领域,结构的损伤检测则关乎结构的安全和完整性。本文将围绕这两个方面展开探讨。
政党凝聚力分析
实验评估
实验使用了2011 - 2015年第54届众议院立法期间627名活跃联邦议员的8378篇演讲。每位议员被视为其当选时所属政党的成员,忽略任期内可能的政党变更。议会数据为开放数据,可从众议院开放数据服务获取。所有实验均在Google Colaboratory平台免费进行。
超参数优化与相关性分析
超参数微调有助于同时反映当前政党结构以及与之形成对比的证据。使用基于TF - IDF统计的矢量化超参数组合和凝聚层次聚类算法,采用不同版本的距离测量方法进行比较。为获得每个超参数指定值集的所有可能配置结果,进行了网格搜索,考虑了以下TF - IDF方法的维度:
- max df (MD) :构建词汇表时,忽略文档频率大于给定阈值的术语。考虑的值为:20, 2⁻¹, …, 2⁻⁵。
- max features (MF) :通过选择不超过该数量的属性来构建词汇表,按其在整个语料库中的频率排序。考虑的值为:10¹, 10², …, 10⁵。
- sublinear tf (ST) :在TF - IDF计算中,用1 + log(tf)替换tf(词频)。考虑的值为:是和否。
- use idf (UI) <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



