34、中文名词回指描述生成的实证研究

中文名词回指描述生成的实证研究

1. 引言

在中文里,回指词可分为零形式、代词形式和名词形式。例如“张三惊慌地往外跑,(他)撞到一个人,他看清了那个人的长相,(他)认出那个人是谁”,其中“(他)”是零形式回指,“他”是代词回指,“那个人”是名词回指。

此前已建立了一套包含句法、语义和语篇导向约束的规则,用于决定零形式、代词和名词回指的生成。然而,名词回指没有像零形式和代词回指那样的独特形式,其描述可以与“初始指称”相同,也可以去除初始指称中的部分信息、添加新信息,甚至使用不同的词汇项。本文旨在研究中文自然语言生成中名词回指合适描述的选择。

以往自然语言生成相关研究主要聚焦于为实体创建“指代表达”,以将其与读者假定关注的一组对象区分开来。这些算法能高效创建描述以明确识别“预期指称对象”,但生成的描述仅反映了语篇的注意力方面。本文尝试从语篇的另一个方面,即意图,来研究名词回指描述的作用,并提出一个偏好规则,用于选择不同的名词回指描述以反映语篇中的意图转变。为验证该规则的有效性,对三组中文文本进行了两次实验。

2. 测试数据中名词回指的分析

中文名词回指的表层结构是一个名词短语,由一个中心名词和可选的关联短语、冠词、关系从句和形容词组成。本文研究的名词描述可看作是上述结构中不含冠词的名词短语。如果名词回指的中心名词与初始指称相同,且其修饰部分是初始指称可选部分的严格子集,则称其为初始指称的“简化形式”;若与初始指称相同,则为“完整描述”。

观察测试数据中出现的名词回指,可将名词描述分类如下:
| 类型 | 初始指称 | 名词回指 |
| ---- | ---- | ---- |
| A | z

源码地址: https://pan.quark.cn/s/d1f41682e390 miyoubiAuto 米游社每日米游币自动化Python脚本(务必使用Python3) 8更新:更换cookie的获取地址 注意:禁止在B站、贴吧、或各大论坛大肆传播! 作者已退游,项目不维护了。 如果有能力的可以pr修复。 小引一波 推荐关注几个非常可爱有趣的女孩! 欢迎B站搜索: @嘉然今天吃什么 @向晚大魔王 @乃琳Queen @贝拉kira 第三方库 食用方法 下载源码 在Global.py中设置米游社Cookie 运行myb.py 本地第一次运行时会自动生产一个文件储存cookie,请勿删除 当前仅支持单个账号! 获取Cookie方法 浏览器无痕模式打开 http://user.mihoyo.com/ ,登录账号 按,打开,找到并点击 按刷新页面,按下图复制 Cookie: How to get mys cookie 当触发时,可尝试按关闭,然后再次刷新页面,最后复制 Cookie。 也可以使用另一种方法: 复制代码 浏览器无痕模式打开 http://user.mihoyo.com/ ,登录账号 按,打开,找到并点击 控制台粘贴代码并运行,获得类似的输出信息 部分即为所需复制的 Cookie,点击确定复制 部署方法--腾讯云函数版(推荐! ) 下载项目源码和压缩包 进入项目文件夹打开命令行执行以下命令 xxxxxxx为通过上面方式或取得米游社cookie 一定要用双引号包裹!! 例如: png 复制返内容(包括括号) 例如: QQ截图20210505031552.png 登录腾讯云函数官网 选择函数服务-新建-自定义创建 函数名称随意-地区随意-运行环境Python3....
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值