口语语言中声学片段出现的建模研究
1. 口语学习问题引入
在人类学习过程中,如何将连续学习过程在程序中建模是一个重要问题。具体包括:如何对人类的连续学习进行建模;从改进学习和教学过程,尤其是语言学习方面能得出什么结论;学习第二语言与学习第一语言有怎样的关联。
研究目标是对音素类别习得过程进行计算建模,将自然口语作为输入,运用进化连接主义系统进行训练。研究重点在于找出“最优”输入特征和系统参数,使输入语言的音素类别能在系统中最快出现。通过追踪系统中目标行为的出现过程,还能对儿童语言习得的关键学习参数提出假设。
基本方法是用自然语言话语的梅尔标度变换来训练进化连接主义结构(神经网络的模块化系统)。主要研究问题是网络能否以及在多大程度上把输入组织成与输入语言音素类别相对应的聚类。在初步实验中,可先研究语言音素系统的特定方面,如辅音 - 元音音节。系统可行后,再处理更复杂的输入。同时,还能模拟多种输入条件下的习得情况:
- 来自一个或多个说话者的输入;
- 小输入词汇量与大输入词汇量;
- 先简化输入(如辅音 - 元音音节),再进行语音更复杂的输入;
- 不同的输入数据序列。
这项研究处于初始阶段,其结果有望为人类/机器认知的一般理论做出贡献,技术应用方面有助于开发自适应系统,提升自动语音识别系统的能力。
2. “先天与学习”困境的再探讨
2.1 总体讨论
当代语言学理论的一个重要问题是人类在多大程度上是基因编程的,不仅是为了习得语言,而且是习得具有特定属性的语言。过去半个世纪,主流观点认为语言的总体架构是先天的,学习者只需少量接触实际语言数据就能设定普遍语法的
超级会员免费看
订阅专栏 解锁全文
141

被折叠的 条评论
为什么被折叠?



