从人工编码到机器学习的欧盟法律约束测量
摘要
学者们采用两种主要方法来衡量欧盟法律中嵌入的行政约束:一种基于不同类型限制使用的变化,另一种基于此类限制的使用频率。它们反映了官僚控制的两种替代概念化,分别被称为"工具箱视角"和"设计视角"。研究表明,约束频率测量在估计立法者约束实施的意图时面临的有效性问题较少,并且往往产生较不严重的测量误差。
研究方法
研究评估了最近一种计算应用在估计约束变化方面的性能,并识别了从人工编码条款进行自动化学习的潜在缺陷。最后,提出了一个基于立法者使用的句法结构的机器学习方法框架,这可能会提高这种创新技术的性能。
关键发现
两种约束比率在四种主要情况下存在差异:
- 当立法者稀疏使用多种类型的约束时,变化比率往往超过频率比率
- 当立法者密集使用少数类型的约束时,频率比率往往超过变化比率
- 主要条款数量越多(即法律越长),变化比率超过频率比率的可能性越大
- 主要条款数量越少(即法律越短),频率比率超过变化比率的可能性越大
机器学习方法评估
研究评估了Anastasopoulos和Bertelli(2020)提出的监督分类方法在估计欧盟法律约束变化方面的性能。该方法在Franchino(2004,2007)人工编码条款上训练了16个梯度提升决策树分类器,用于10个约束类别。
只有五个分类器表现良好:三个针对某中心实施情况,两个针对成员国实施情况。其余分类器表现中等或较差。针对成员国实施约束的分类器整体表现更差。
基于句法结构的机器学习方法
研究提出了一种三步骤程序:
- 依赖解析:从文本语料库中提取详细的词汇和句法信息
- 命名实体识别:训练两个NER模型识别执行机构和动词类别
- 模式匹配:将句法依赖解析的注释与两个NER模型的预测相结合
初步有效性评估显示,这种方法在估计约束使用频率方面显示出潜力,特别是在处理某中心约束时表现更为准确。
结论
基于约束类型变化的测量方法可能在短法律中低估立法偏好,在长法律中高估立法偏好。而基于使用频率的测量方法面临的有效性问题较少。机器学习方法在法律文本分析中具有巨大潜力,但仍需谨慎设计和人工验证。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
1075

被折叠的 条评论
为什么被折叠?



