Wee5-4PP attachment 3

本文探讨了在算法开发过程中,通过使用额外特征、巧妙处理缺失信息、利用语义信息和增加上下文来提高算法性能的方法。同时,提出了结合所有可能的算法和其他改进措施的建议。

Accuracy in test data

  • Alg2 63%
  • Alg2a outperforms Alg2(Rule 3), 70%

Summarization

这里写图片描述

Memorizing everything is not a good idea!!

What additional sources can we use to improve the algorithm?

  • use a few more good features(e.g. more prepositions, more verbs and nouns?)
  • use clever ways to deal with missing information(how to deal with the tuples that does appear in the training set but are similar with some tuples in the training set)
  • use semantic information(e.g. synonyms)
  • use additional context

Statistics of PP attachment

这里写图片描述

Collins and Brooks(Back off)

  • Combine all the possible algorithms.
    这里写图片描述

Other methods

这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值