输入强化对修辞倒装教学的影响

Mirosław Pawlak* 和安娜·米斯特科夫斯卡‐维尔特拉克

拉克向高级学习者教授修辞倒装:输入操控与个体差异变量的交互作用
https://doi.org/10.1515/iral‐2017‐0032

摘要

尽管已有大量研究探讨了不同教学方法的效果,但对于个体差异(ID)变量如何调节这些方法的作用仍知之甚少。该研究旨在通过考察三种不同类型的基于输入的干预在语法学习策略使用和对语法教学信念方面的调节作用,填补这一空白。实验组在三次45分钟的时段内接受英语修辞倒装结构的教学,这些课程为常规安排的课时,采用三种形式的输入强化:视觉输入强化、听觉输入强化以及两者的结合;而对照组则专注于常规课程内容。目标语言特征的掌握情况通过前测、即时后测和延迟后测进行评估,旨在测量显性和隐性知识在接受性与产出性维度上的表现。学习策略的使用和信念通过其中一位作者设计的测量工具进行评估。分析结果显示,尽管所有实验组的表现均优于对照组,但在大多数情况下并不存在统计显著差异。此外还发现,语法学习策略和信念是重要的调节变量,尽管其具体影响尚无法完全确定。

关键词 :输入操控,文本强化,内隐与外显知识,语法学习策略,对聚焦形式教学的信念

1 引言

形式化或聚焦于形式的教学(FFI)对二语习得的影响一直是该领域中争论最为激烈的问题之一(参见多蒂和威廉姆斯 1998;洛温 2015;纳萨吉和福托斯 2011;纳萨吉 2017)。如今,关于该问题的讨论主要由两种观点主导:一种认为教学的作用有限,另一种则认为在满足特定情况的前提下,教学可以带来优势(参见贝纳蒂 2016;范帕滕和贝纳蒂 2015)。尽管输入对于任何类型的语言学习的重要性无可争议,但目标语言(TL)中某些方面即使经过大量接触,其习得过程仍可能耗时极长甚至无法实现(斯温 1998),特别是当相关语言特征的感知显著性较低或在语义上显得冗余时。因此,可以合理推断,对这类语言形式的习得可能得益于某种形式的教学,以促进学习者在输入中注意这些形式(施密特 1990)。正如贝纳蒂 (2016: 1) 所指出的,有关各种教学选择有效性的研究已发展到这样一个阶段:教学干预的积极作用已不再受到质疑,当前需要探讨的问题是,对输入的操控是否确实能够为语言学习者正在发展的语言系统带来持久的变化。

Sharwood Smith(1991年,1993年)将使目标语言特征在输入中变得更加显著的尝试称为输入强化,用以指代一种特定类型的教学干预,其目的在于引导学习者关注某一特定的语言形式。该术语涵盖了一系列具有不同显性程度和深化程度的程序,其中前者表示对语言形式进行注意力引导的直接程度,后者则与教学干预的持续时间和强度相关。在显性强化中,教师提供规则和元语言解释;而在隐性强化中,学习者的注意力通过意义导向活动被引导至特定形式。就深化程度而言,学习者可能会经历一系列课程,在这些课程中,针对某一特定形式的解释会伴随因违反规则而产生的错误的反复纠正;或者此类纠正和解释仅提供一次。还可以区分正向输入强化与负向输入强化:前者指对学习者所接触的输入进行操控,后者指由于显性教学或提供纠正性反馈(CF)而导致输入得到强化。另一个关键问题是输入强化可分为内部型或外部型(Sharwood Smith 1991年)。如果学习者通过参与认知过程或运用语言学习策略自行注意到语言形式,则属于内部强化。外部强化则通过教师或专门设计的教学材料的介入而实现。显然,这些分类之间存在重叠,因此可能产生显性较低且深化程度较低的技术,也可能出现显性较高且深化程度较高的技术,或同时兼具外部和内部特征的混合类型。

内部的、积极的或消极的。众所周知的外部且积极的输入强化技术包括输入泛滥或丰富输入,即让学习者接触某一特定形式的多个实例;以及文本操作/增强,即通过高亮、加粗、颜色编码或斜体等方式在书写中对输入进行字形上的修改,或在口头产出中通过重复或加强强调来实现。该方法基于以下假设:通过提高语法形式的显著性,此类视觉和语音修改有助于学习者注意这些形式,从而使其更易于掌握。隐性纠正性反馈可以表现为重铸,即“对学习者前一次话语全部或部分内容的重新表述,在此过程中一个或多个不符合目标语特征(词汇、语法等)的项目被相应的目标语言形式所替代,并且在整个交流过程中,对话者的关注点在于意义而非语言本身”(朗 2006:第2卷)。

迄今为止开展的大多数研究要么侧重于探讨包含各种与输入相关技术的教学干预的有效性,要么比较涉及输入强化的教学干预与其他类型教学干预(无论是传统的,还是输出或互动型教学)所产生的教学效果。然而,关于个体差异(ID)变量在其中的中介作用的研究却很少。鉴于本研究项目的重点,首先将简要概述迄今为止相关的实证研究,然后介绍一项旨在探讨不同类型的基于输入的教学方法(即文本强化、重铸以及两者的结合)与两个个体差异因素——语法学习策略(GLS)的使用及对FFI不同方面的信念——之间交互作用的研究。

2 文献综述

许多实证研究已经开展,旨在探讨文本强化和丰富化在外语或第二语言学习中的有效性,但其结果似乎并不一致:尽管一些研究证实了该方法的有效性,但另一些研究并未发现文本强化具有显著效果。总的来说,有关输入强化的研究考察了不同类型的强化方式、输入类型、输入处理背后的认知操作,以及它们对注意和目标形式习得的贡献。正如Reinders和Ellis(2009:第28卷)所指出的,“[a]关于强化和丰富化输入有效性的关键问题是学习者是否真正注意到了目标结构”。

为此,朱尔达内斯等人(1995)探讨了以加下划线、加粗、阴影和使用不同字体等形式进行文本强化对注意和产出西班牙语简单过去时和未完成过去时形式的影响。通过比较两组受试者的表现在于:一组接触经过强化的文本,另一组接触未经强化的文本,涉及两项进步测量,即在执行基于文本的书面任务时完成的出声思考协议以及参与者创建的叙述。尽管通过出声思考程序获得的数据未显示两组之间存在任何差异,但对叙述中所用语言的分析表明,强化组在准确性和目标特征产出实例数量方面均具有显著优势。舒克(1994)的研究也报告了文本强化组的优势。在此研究中,两组受试者处理的是通过加粗和大写字母来提高目标形式显著性的段落,其中一组还额外接受了形式聚焦教学。这两组学生的表现优于对照组学生,后者阅读的段落未经过任何形式的强化。同样,王(2003)通过纸笔测试验证了包含强化的教学干预带来的积极效果。王还为实验组提供了多种不同的处理方式(即增大字体、斜体和下划线),并区分了句子层面和语篇层面的输入,以确定这一变量如何影响将文本强化作为教学选项的效果。西马尔(2009)则调查了在同一文本中采用不同形式强化的差异性效应(即仅斜体、仅加下划线、仅加粗、仅高亮显示、仅大写、斜体、下划线、加粗、高亮和大写的组合,以及加粗、下划线和大写的组合,还有无文本强化)。虽然不同的技术以不同方式影响学习者的吸收,其中三种提示类型的组合以及大写字母效果最佳,但所有这些组的成绩均高于文本未作任何修改的学生。不同类型强化(即下划线、加粗、斜体、字体大小变化、使用大写字母或更换字体)的效果也是拉布罗齐(2016)最近一项研究的重点,该研究表明实验组在翻译任务以及针对与文本相关的形式或意义映射的多项选择题测试上优于对照组。赖纳兹和埃利斯(2009)则指出,通过让学习者接触包含多个主谓倒装副词短语实例的口头和书面文本(即输入泛滥)来丰富输入,能够促进吸收并有助于隐性知识的习得。

一些证实输入强化益处的研究结果,被许多未能显示出该技术显著积极效果的研究所抵消。例如,在阿兰恩(1995)的研究中,四个组阅读了文本的不同版本:第一组阅读未经强化的文本,第二组阅读目标形式以斜体标注的文本,第三组获得了关于目标形式的显性信息,但他们阅读的文本未经过强化,最后,第四组既获得了显性信息,又阅读了文本的强化版本。通过出声思维协议、句子补全任务和语法判断测试来评估对目标特征的注意和习得情况。尽管单独的强化并未影响产出,但其在注意方面的影响在出声思维协议中有所体现,因为处理强化文本的参与者在这一指标上表现优于其他组。对语法形式的注意和习得也是怀特(1998)研究的重点,他揭示了文本强化的效果取决于强化类型(即加粗、下划线、斜体)以及强化的数量,从而表明结合不同强化技术的好处,但也提醒指出,各种类型的输入操作可能对二语习得产生不同的影响。尤尔德奈斯等人(1995)的研究设计被奥弗斯特里特(1998)所复制,研究聚焦于西班牙语中简单过去时与未完成体之间的区别,该焦点结构被用于同一故事的两个版本中:一个版本通过加粗、下划线和增大的字体大小进行了修改,而另一个版本则未作任何操作。涉及书面叙述和正误理解检查的前测‐后测设计揭示了强化对理解产生了负面影响,这归因于过多的不同形式强化所产生的不利影响,可能令人误解。廖(1997)调查了文本强化对西班牙语非正式命令式动词形式的理解和吸收的影响。研究中使用的段落有四个特征加以区分:它们要么经过强化(即通过加粗和下划线),要么未强化;文本长度或长或短。多项选择测试的结果并未显示出文本强化对理解的益处。此外,廖(2001)的另一项研究结果表明,在阅读文本时通过出声思考协议发现,接触过强化(即通过加粗和下划线)和未强化文本的学习者注意到的形式数量之间没有差异。同样,在廖等人(2003)的研究中,文本强化(即带下划线的动词、加粗的时态词素、增大的字体大小)对于注意文章中向参与者呈现的目标特征而言几乎没有影响。

李(2007)报告了混合的结果,一方面揭示了文本强化(即目标特征的字体增大、变化和加粗)对学习被动语态的影响,但另一方面也显示其对意义理解有负面影响。温克(2013)通过眼动追踪补充了李(2007)的研究设计,获得的数据证实了强化有助于注意。然而,温克并未发现支持该技术有助于习得的证据。总体而言,李和黄(2008)进行的一项元分析研究在所审查的16项研究中确立了文本强化非常小的效应量,这可能归因于研究设计和研究目标之间的方法学差异。类似地,Han 等人(2008;引自纳萨吉和福托斯 2011:45)指出,由于存在严重的方法论问题,探讨输入强化有效性的研究结果可能不具有可推广性。他们的综述得出了以下结论:(1)强化有助于在有意义的输入中注意语法特征;(2)如果学习者具备该形式的先验知识,则可能促成习得;(3)如果这些形式具有意义,则可能实现对形式的自动注意;(4)当强化发生在理解之后而非与理解同时发生时,更有可能促进注意;(5)对有意义形式的强化有助于理解;(6)对无意义形式的强化不会妨碍理解;(7)当强化吸引学习者的焦点注意而非边缘注意时,效果更佳;(8)复合强化相比简单强化可能引发更深层次的认知加工。

通过增加特定目标语言形式的感知显著性来对输入进行字形或语音操作,并不是语言课堂中唯一可采用的教学选择。这一目标也可以通过协商互动过程中的互动反馈来实现(Nassaji 和福托斯 2011:第20卷),在此过程中,学习者在出现语法错误时会收到以澄清请求、确认检查、重复或重铸形式提供的纠正性反馈。正如霍克斯和纳萨吉(2016:第20卷)所指出的,“与其他所有纠正性反馈技术相比,重铸受到了研究者最多的关注”,这主要是因为它在外语课堂中似乎比其他任何类型的纠正性行为都更为常见。同样重要的是,这种隐性纠正形式不会妨碍交流的流畅性(参见道蒂和瓦雷拉1998;尼古拉斯等人 2001),且相较于其他纠正性反馈类型显得更为不显眼。朗(1996,2006)强调了重铸对于目标语形式习得的重要性。

有理由认为,这种反馈方式在持续的话语中将形式与意义联系起来,促进了对语言形式的注意和在短期记忆中的重复,这是隐性学习中涉及的关键过程。道蒂(2001)则认为,重铸为认知机会窗口的出现创造了条件,在此窗口内,学习者可以对自己刚刚听到的语言形式和自己的输出进行心理对比。

尽管有这些益处,但作为纠正性行为的重铸在两个主要二分法方面仍存在诸多争议,即重铸是显性的还是隐性的,以及它们所提供的证据是正面证据还是负面证据。与朗(1996,2006)和道蒂(2001)的观点相反,并非所有重铸都是隐性的;有时重铸的纠正意图十分明显,因此其显性特征不容置疑(参见埃利斯等人(2009))。因此,重铸是否仅提供正面证据也并不确定。一方面,学习者通过听到正确的形式而获得此类正面证据(埃利斯和肖恩 2006;尼古拉斯等人 2001);然而,如果这种改述方式被理解为纠正性反馈,则应被视为提供了负面证据。此外,尽管重铸主要是提供输入,但有时也会促使学习者修改其产出,这符合斯韦恩(1985)提出的推动式输出理念,即如果目标语言形式的产出以某种方式被诱导或鼓励,学习者便能在互动过程中习得这些目标语形式。重要的是,只有当学习者真正注意到自己话语中所作的修改时,重铸才可能产生吸收等有益效果。吸收指学习者在接受纠正性反馈后使用正确形式的行为,其出现频率通常被用作衡量各种纠正性行为有效性的标准。研究表明,相较于澄清请求,重铸所产生的吸收实例较少(例如,埃利斯等人 2001;莱斯特 1998;莱斯特和兰塔 1997),因此该技术的有效性受到质疑。然而,一些研究者(参见洛温 2005;洛温和菲尔普 2006;尼古拉斯等人 2001)指出,吸收以及其他注意指标可能无法完全捕捉重铸的益处。正如麦基和菲尔普(1998)所指出的,缺乏吸收并不一定意味着未发生注意。因此,在近期的研究中,采用前测‐后测设计来评估重铸的效果(例如,韩 2002;莱斯特 2004;埃利斯等人 2006;纳萨吉 2006)。显然,本文无法详尽介绍大量探讨重铸对语言发展影响的研究。尽管如此,忽略该领域内的综述性和元分析研究(例如,霍克斯和纳萨吉 2016;李 2010;莱斯特和斋藤 2010;莱斯特等人 2012;纳萨吉 2015;肖恩 2011)将是一个重大疏漏,这些研究均证实了重铸的积极效果。

鉴于这两种技术在FFI研究中的广泛共鸣,输入强化与重铸似乎都是可行的教学选择,可用于促进二语或外语学习者对语法的掌握。然而,据作者所知,迄今为止尚无研究比较过这两种方法在单独使用或结合使用时,在内隐与外显知识的产出与接受维度上的有效性。还应强调的是,无论教学技术多么有效,其效果都会受到学习者个体特征的调节。这种个体特征包含众多变量,但以往研究仅探讨了其中少数几个变量的调节作用(例如工作记忆、年龄、焦虑、学习风格;参见帕瓦拉克 2017a,帕瓦拉克 2017b),且并未涉及不同类型输入强化的影响。本报告所述的研究旨在填补这一空白,通过考察对FFI的信念和 GLS在视觉与听觉输入强化以及两种方式的结合对不同类型的TL知识影响中的调节作用。在此需指出两个问题:首先,尽管已有不少研究探讨了信念在FFI中的作用(参见帕瓦拉克 2011,2013a;相关综述),但关于GLS的研究仍处于起步阶段(帕瓦拉克 2013b);其次,此前尚未有研究考察这两个因素在特定 FFI教学选择(尤其是不同类型的输入强化)中的调节作用。综合以上因素,该研究在三个方面具有重要意义:(1)它考察了一种此前未被探索过的教学选择组合(即视觉与听觉输入强化);(2)它分析了教学干预对内隐与外显知识的影响,并考虑了其不同的维度;(3)它揭示了两个此前未被研究过的ID变量的调节作用,无论是在FFI整体层面,还是针对本研究中所使用的教学干预手段。

3 该研究

3.1 目的和研究问题

如上所述,该研究探讨了不同类型的基于输入的语法教学的相对效果,同时考虑了所选个体差异变量的中介作用。研究涉及三种教学干预方式,即视觉输入强化(IE)、重铸(R)——一种听觉输入强化形式,以及两种方法的结合(IER)。目标语言特征是英语中的修辞倒装,其使用涉及不同时态和助动词。

动词在不同语境中以及作为某些固定短语的组成部分(例如:Little did he know⋯⋯,Hardly had she got up when⋯⋯,Never has she seen⋯⋯,Under no circumstances should you trust⋯⋯)。本研究选择的个体差异因素包括语法学习策略和对形式聚焦教学的信念,这两者均与语法结构的学习和教学密切相关,因此可被认为会调节三种干预类型的作用。具体而言,该研究旨在回答以下三个研究问题:
1. IE、R和IER对英语倒装掌握的影响是什么,该影响以显性和隐性知识的产出与接受维度来操作化?
2. 这三种教学干预类型中,哪一种在短期和长期更为有效?
3. 干预效果是否受到语法学习策略和对形式聚焦教学的信念的调节?

3.2 参与者

参与者为45名波兰两所高等教育机构中三年制本科课程二年级的英语专业学生(31名女性和14名男性),他们来自四个完整的班级,被随机分配到视觉输入强化(IE——14名学生)、重铸(R——7名学生)、视觉输入强化与重铸结合(IER——12名学生)以及对照组(C——12名学生)四种情况中。所有参与者均为该课程二年级学生,平均年龄为21岁,学习英语作为外语的时间平均约为12年,范围从5年至18年不等。就其熟练程度而言,根据欧洲共同语言参考框架,他们的水平介于B2和C1级之间,但需要强调的是,四个组内的学生之间存在较大的个体差异,部分学生勉强达到该水平,而另一些学生则超过此水平。正如波兰英语学位课程的典型特点,这些学生在接受以发音、语法、口语与听力、综合技能和学术写作为主的强化英语教学课程。他们还需修读语言学、英美文学与历史以及有效的第二语言学习问题等内容课程,其中大多数课程使用目标语言授课,尽管这并不排除偶尔使用他们的母语波兰语。尽管大多数参与者表示他们在校外有机会接触目标语言,但通常仅限于互联网、电影、音乐或书籍,极少有机会与母语者或熟练的英语使用者进行面对面交流。

对于本研究特别相关的是,第一学期末语法课程的平均成绩为3.38(标准差= 0.6),评分范围为2到5;而学生对语法在英语学习中重要性的评价为3.87(标准差= 0.77),评分范围为1到6,后一数值说明学习者对该子系统作用具有一定的认识,同时也表现出在此方面的一定程度的个体差异。

3.3 设计

该研究在为期两个月的常规课程期间进行,采用前测—即时后测—延迟后测的设计。如图1所示,该研究设计中的前测于第1周在四个组中均进行。随后,在第2和第3周,三个实验组接受了连续三节课的教学干预,而对照组则继续参加相应课程中的常规活动。教学干预结束后,第4周在四个组中进行了即时后测(即后测1)。三周后,在第7周进行了延迟后测(即后测2),并要求参与者填写有关所调查的个体差异变量(即语法学习策略和信念)的问卷。还应注意的是,由于时间安排限制,四个组之间的教学环节和测试时间存在一些差异。

组别,但并未以任何方式影响该研究的整体设计,也未危及研究程序的有效性和可靠性。

3.4 目标特征

如上所述,目标特征是英语中修辞倒装的不同变体。这一选择经过了仔细考虑,因为考虑到学生的水平,可以假设他们在使用更常见结构(如被动语态)时不会遇到太大困难,至少在较为受控的活动中如此。英语中的修辞倒装可被视为一种复杂的结构,无论是在显性知识方面(即有意识的、受控的,且仅当学习者有充足时间访问所需规则时才可获取),还是在隐性知识方面(即无意识的、自动的,并可在实时中轻松获取),以及高度自动化的显性知识方面(即可能保持有意识但在自发性交际中可轻松获取)(参见德凯泽 2010;埃利斯 2009)。

如果我们采用文献中常提到的标准(如德凯泽 2005;埃利斯 2008;帕瓦拉克 2006,2012),显然,例如,从显性知识角度来看,使这一结构难以掌握的原因在于其形式和功能上的复杂性、不可靠性、应用范围狭窄、在学生母语中缺乏对应形式,并且其引入需要使用元语言以及对其他语法结构的参照。就隐性知识或高度自动化的显性知识而言,掌握倒装结构构成了重大挑战,因为它要求执行复杂的(第6阶段)加工操作(皮内曼(1998)所讨论的),并且它在口语和书面输入中出现频率较低,也不显著,主要由于语义冗余所致。

3.5 教学干预

目标结构的高度复杂性所带来的推论是,在教学过程中,尤其是在规划干预措施时,研究人员面临着如何促进语言知识发展(特别是隐性或高度自动化的显性知识)的挑战。如上所述,IE、E 和 EIR 组的教学干预持续了两周时间,分三节课进行,这些课程通常用于讲授二语语言教学研究方法,由作者之一授课。具体而言,干预是在45分钟的时段内进行的每节90分钟的课程中,其余时间用于实现该课程设定的常规课程目标。所有实验组的学生都被要求阅读文本并完成侧重于理解目标特征的任务,但由于处理条件的不同,实施方式存在差异。在IE组中,所有材料中出现的英语倒装均被加粗显示,在参与者讨论文本或完成任务(无论是结对、小组还是全班进行)时,不采用其他教学程序。特别地,不讲解相关规则,也不对使用目标特征时出现的错误提供纠正性反馈。以下是某次教学环节所用文本的节选,附有样例理解问题以及要求学生完成的任务示例:

我不仅非常喜欢运动,还热爱新的挑战,尤其是那些带有一点风险的挑战。我经常和朋友 托尼及布鲁斯一起尝试新事物。事实上,要不是因为布鲁斯,我也不会了解到这个新爱好—— 速降跳(rap jumping)。我之前并非没有做过蹦极——就是把脚绑在一根长长的弹性绳 上,从起重机或桥上跳下去的那种运动——所以对他所说的内容还是有些概念的。然而, 后来我发现,我们即将尝试的项目远非我所想象。布鲁斯向我保证,速降跳不仅比蹦极更 危险,而且也刺激得多。但他却对此守口如瓶,为的就是让我保持悬念。我当时兴奋得迫 不及待想要亲自尝试一下(Foley 和 Hall 2003)。

判断下列陈述是否正确,并证明你的答案:
1. 作者以前从未进行过蹦极跳。 对/错
2. 布鲁斯告诉他自己新的爱好:蹦极跳。 对/错
3. 当作者到达建筑物顶部时,他知道将会发生什么。 对/错

不仅⋯⋯,作者还⋯⋯。他经常尝试⋯⋯。要不是布鲁斯⋯⋯,就不会学会蹦极跳。

在R组中,使用了完全相同的材料,但有两个关键区别:第一,未使用加粗;第二,当参与者在使用目标结构时出现错误,会采用重铸方式进行纠正,并通过加重语气来突出正确的形式,例如:学生:Little he realize the danger,教师:Little DID HE REALIZE the danger … and what happened? 重铸既在教师在场时的结对和小组活动中提供,也在全班讨论期间提供,且纠正性反馈为聚焦类型(参见Sheen 和 Ellis 2011)。在EIR组中,结合使用了这两种方法,学生既能通过加粗获得排版强化,又能在使用倒装结构出错时得到重铸。对照组在语法课上未针对目标结构进行专门训练,遵循的是语言教学研究方法的常规课程。然而,不能排除他们可能在其他课程或课外接触过这种形式。需要强调的是,在整个研究期间,其他课程(尤其是英语强化课程)的教师被要求不要关注修辞倒装。

3.6 数据收集与分析

收集了两种类型的数据,旨在回答研究问题,即前测、即时后测和延迟后测中使用的成就测量得分,以及参与者在两份问卷中的回答。关于测试,在三次测试(前测、后测1和后测2)中均采用了四种不同的任务,以了解显性和隐性(高度自动化)知识在产出与接受维度上的变化情况。尽管各项任务的形式完全相同,但前测和两次后测所包含的题目内容不同。为确保前测、后测1和后测2所用评估工具的等效性,特别注意在倒装使用的情境类型和数量方面保持一致,并使用相同的动词,但置于不同的句子中。这四项测量工具如下:

(a)显性产出性知识测试——一种传统的纸笔测试,包含15个关于倒装用法的句子改写,例如:They left the car and almost immediately heard a deafening crash. No sooner … 或 He was greedy and jealous as well. Not only …;尽管有时间限制,但时间足够学生调用相关规则,必要时还可额外给予时间;参与者若句子完全正确得2分,若存在一些小问题(如使用了错误的不规则动词形式)则得1分;

(b)显性接受性知识测试——一种不限时的语法判断测试,要求参与者判断一个句子是否正确,并在认为某个项目存在错误时提供解释;该测试包括十个正确句子和五个错误句子,例如:Had she not been warned about the risk, she would have stayed outside(正确),Rarely does my mother leave home these days and at no time should she be left on her own(正确),以及Not until the guards searched our luggage, we were allowed to enter the building(错误);每位参与者每答对一题可得1分,每提供一个可接受的解释另加1分。

(c)一项隐性产出性知识测试——在阅读包含修辞倒装实例的文本后,根据一组提示复述故事;参与者先拿到文本,并有一定时间浏览以记住主要思想;随后文本被收回,再提供一组提示,提示内容反映了文本中事件的顺序以及表明需要使用倒装的语言线索;以下是该文本的节选及相关提示示例:

当彼得终于进入纽约时,大雨倾盆而下,交通异常拥堵,他担心自己无法及时到达会面地点。他刚一到达曼哈顿下城,一场雷暴雨便开始了。他完全不知道,这种恶劣天气最终竟会救了他的命。情况变得越来越糟,他突然想到,他一生中从未见过这座城市街道上有这么多水和如此混乱的场面。不仅驾驶变得越来越困难,而且有些人也开始弃置他们的汽车在路中间。

当彼得到达纽约时⋯⋯不等⋯⋯曼哈顿下城,就⋯⋯很少 ⋯⋯如此恶劣天气⋯⋯这些情况⋯⋯他一生中从未见过这么多水⋯⋯不仅⋯⋯越来越困难⋯⋯

学生独立完成任务,其表现通过放置在他们面前桌子上的录音机进行录音记录;共有15个必用语境用于倒装,句子完全准确可得2分,出现轻微错误可得1分。

(d)一项隐性接受性知识测试——基于PowerPoint演示文稿的限时语法判断测试;参与者被展示一组十五张幻灯片,每张包含一个单个句子,其中十个为正确句子,五个为错误句子,例如:我妹妹刚启动点火就听到一声巨大的爆炸声(正确)、他很少称赞别人(正确)和只有当汤姆下班回来后,玛丽才意识到他一定瘦了很多(错误);每位学生每张幻灯片可见七秒钟,之后自动显示下一张幻灯片;每个正确答案得1分。

通过对测试收集的数据进行分析,首先对测试进行评分,然后计算每组在三项测试中的均值和标准差。针对产出性测量的一个数据样本计算了评分者间信度,一致百分比达到95%,该数值令人满意。进行了重复测量和单因素分析。

采用方差分析来确定组内和组间比较的显著性,随后进行Tukey HSD事后检验,以确定三次测量实例之间以及四个组之间得分差异的显著性。

该研究旨在调查的个体差异变量(即语法学习策略和信念)通过两份问卷进行测量,参与者在延迟后测结束后立即完成这两份问卷。语法学习策略的使用情况采用帕瓦拉克(2013b)设计的工具进行评估,该工具包含70个五点李克特量表项目,分为元认知、认知、情感和社会策略四类。其中第二类最为广泛,涵盖了直接应用于语法学习的策略手段,并进一步细分为四个组:即在交际活动中与形式聚焦相关的语法学习策略、与显性知识发展相关的语法学习策略、有助于隐性知识发展的语法学习策略(包括适用于输出导向和基于输入的学习,以及控制性练习和自发性练习的策略),以及与提供纠正反馈相关的语法学习策略。该工具的内部信度一致性已在先前的研究中得到验证(帕瓦拉克2009年),克朗巴哈系数值为0.82。鉴于本研究项目的重点,仅考虑了认知类语法学习策略类别中的10个项目,即反映有助于隐性知识发展的策略手段的项目(例如,“我做大量练习来巩固语法”或“我通过听和读包含大量某一语法结构示例的文本进行学习”)。参与者对形式聚焦教学的信念则通过帕瓦拉克(2011,2013a)开发的工具进行测量,该工具包含30个五点李克特量表项目,涉及语法教学的不同方面(即形式聚焦教学的整体重要性、课程大纲设计、规划以语法为基础的课程、引入语法结构、语法点练习方式以及语法错误纠正)。该工具具有足够的内部信度一致性,如以往研究所证实的(即帕瓦拉克 2011,2013a),克朗巴哈系数值为0.81。与收集语法学习策略数据的问卷一样,此处也仅选取了相关项目,即涉及对不同类型语法练习信念的项目(例如,“我认为在交流中使用语法结构很重要”或“我倾向于先理解一个结构的用法,然后再进行产出”)。

为了确定相关语法学习策略使用和信念的中介效应,计算了参与者对问卷项目的回答与其在四项测量指标上前测与延迟后测得分差异之间的皮尔逊相关系数。

3.7 研究结果

3.7.1 隐性知识的产出与接受维度的测量

表1列出了四个组在涉及隐性知识的两项任务的前测、即时后测和延迟后测中的均值和标准差,而图2和图3则以图表形式展示了这些组在该类表征的产出与接受维度上随时间的变化表现。关于隐性产出性知识的发展,尽管三个实验组在前测中的表现均优于对照组,但所有差异均未达到统计显著水平。在即时后测和延迟后测中,尽管IE组的表现始终最佳(分别为12.29和15.57),其次是IER组(分别为11.5和12.08)和R组(分别为8.43和10.0),但组间差异仍未达到统计显著水平;然而,所有实验组的表现均优于对照组(分别为1.9和1.86)。

就组内差异而言,在IE组中,初始阶段高达6.93的显著提升不仅延续到了即时后测,而且在延迟后测中进一步增加了3.38。

M (SD) 前测 (P) M (SD) 即时后测 (P₁) M (SD) 延迟后测 (P₂) 变化
IP IR IP IR IP IR
IE (14) 5.36 9.86 12.29 10.50 15.57 10.93 IP: P₂ > P, P₁; IR: 无显著变化
(4.77) (1.99) (2.59) (6.47) (1.49) (5.92) (1.49)
R (7) 3.86 8.14 8.43 9.86 10.0 9.14 无显著变化
(4.04) (0.90) (0.69) (4.35) (2.04) (7.33) (2.04)
IER (12) 4.67 8.75 11.5 12.00 12.08 9.67 IP: P₁ > P, P₂ > P; IR: P₁ > P, P₂ < P₁
(6.88) (1.66) (1.35) (5.74) (1.30) (4.85) (1.30)
C (12) 0.16 6.08 1.9 7.58 1.86 5.77 IP: P₁ > P; IR: P₂ < P₁
(0.58) (1.98) (1.56) (2.72) (1.01) (1.56) (1.01)
Sig. IE, IER > C IE, R, IER > C IE, R, IER > C IE, R, IER > C IE, R, IER > C IE, R, IER > C
注:IP 和 IR 分别表示产出性隐性知识和接受性隐性知识;Sig. 表示在 p < 0.05 水平上的统计显著差异。

在IER组中也观察到类似的模式,平均分从前测到即时后测提高了6.83,随后又进一步提高了0.58,但这一增长不再具有统计显著性。在整个实验过程中,R组未观察到统计显著的提高,即时后测后也未出现显著提升。

关于接受性内隐知识,三个实验组在三项测试中的表现均显著优于对照组。此外,IER组在即时后测上的表现优于R组,IE组在延迟后测上优于R组,差异分别为2.14和1.79,且达到显著水平。就四个组的学生在整个研究过程中的进步而言,变化仅在IER组和C组中具有统计显著性,前者从即时后测的8.75提高到12.0,随后在延迟后测下降至9.67;而后者的表现则从后测1到后测2有所下降(7.58 vs. 5.77)。有趣的是,此次学生之间的个体差异较小,低标准差值(0.69至2.59)证明了这一点。

显性知识的产出与接受维度的测量

与实验组和对照组在前测、即时后测及延迟后测中显性知识表现相关的数据已在表2中列出,并分别针对产出性和接受性维度在图4和图5中进行了图示。显而易见的是,所有组在显性知识测量上的表现均明显优于隐性知识,例如,这两类知识的最高得分分别为21.33和15.57。这一点并不令人意外,因为显性知识测试为参与者提供了充足的时间来调用相关规则并进行监控,尤其是在产出模式下。

就显性产出性知识而言,三个实验组在前测、即时后测和延迟后测中的表现均优于对照组,且组间均值差异具有统计显著性。同时,尽管IE组、R组和IER组的进步幅度有所不同(IER组表现最佳,即在连续测试中的得分为13.83、19.58和19.83,而IE组为12.29、18.21和19.50,R组为9.29、15.00和17.42),但这些差异未达到显著水平。就组内差异而言,四个组均呈现出相似的模式,即参与者在即时后测和延迟后测中的表现均显著优于前测,尽管实验组从后测1到后测2的进步幅度为0.25–2.42,但未达到显著水平。

还应注意的是,IE组的标准差值相当高,高达9.31。接下来关于显性接受性知识的组间差异,其模式与产出情况相同。

M (SD) 前测 (P) M (SD) 即时后测 (P₁) M (SD) 延迟后测 (P₂) 变化
EP ER EP ER EP ER
IE (14) 12.29 12.43 18.21 19.57 19.50 19.14 EP, ER: P₁, P₂ > P
(9.31) (6.71) (3.78) (5.03) (4.35) (5.32) (4.35)
R (7) 9.29 11.14 15.00 18.56 17.42 18.66 EP: P₁, P₂ > P; ER: P₁, P₂ > P
(6.87) (5.798) (2.27) (3.51) (3.76) (5.09) (3.76)
IER (12) 13.83 12.25 19.58 21.33 19.83 16.91 EP: P₁, P₂ > P; ER: P₁, P₂ > P; P₂ < P₁
(8.84) (7.05) (5.16) (4.85) (5.88) (5.49) (5.88)
C (12) 2.75 3.75 6.29 13.71 4.33 11.00 EP, ER: P₁, P₂ > P
(3.64) (3.31) (4.27) (3.63) (4.10) (2.02) (4.10)
Sig. IE, R, IER > C IE, R, IER > C IE, R, IER > C IE, R, IER > C IE, R, IER > C IE, R, IER > C
注:EP 和 ER 分别表示显性产出性知识和显性接受性知识;Sig. 表示在 p < 0.05 水平上的统计显著差异。

所有三个实验组在教学干预前后均显著优于对照组,而IER、IE和R在连续测试中的差异未达到统计显著水平(即IER分别为12.25、21.33和16.91,IE分别为12.43、19.57和19.14,R分别为11.14、18.56和18.66)。同样,关于这三个组随时间推移的进步情况也是如此,因为所有组(包括对照组)在两次后测中的表现均优于前测,尽管从即时后测到延迟后测可能存在成绩下降。然而,只有IER组从后测1到后测2下降了4.42,这一降幅达到了统计显著水平。就个体差异而言,其水平明显低于产出维度的情况,但差异小于隐性知识的情况。

语法学习策略使用与对形式聚焦教学的信念之间的中介效应报告

该研究还旨在确定所报告的语法学习策略使用和对形式聚焦教学的信念在所调查的教学选择作用中的中介效应,但结果远未得出明确结论。就语法学习策略而言,尽管发现了一些前测与延迟后测成绩提升之间的相关性,但并非所有相关性都是正向或显著的。更准确地说,唯一可被视为中等强度且具有统计显著性的相关性是语法学习策略的使用与显性接受性测试表现之间的相关性。

在IE组中,GLS的应用与隐性接受性知识之间存在负相关(r = -0.52),尽管其解释了约27%的方差,但呈负向关系。这意味着GLS使用越频繁,参与者的成绩反而下降,这一发现难以解释。其他相关性均未达到统计显著水平,尽管在R组中,GLS应用与隐性产出性知识测试之间的相关系数为正值且接近强相关(r = 0.65),理论上可解释42%的方差。其他值得注意但未达到显著性的结果包括:在R组和IER组中,报告的GLS使用与隐性产出性知识测量得分之间呈正相关(分别为r = 0.38和r = 0.22)。关于信念方面,在IER组中,信念与隐性接受性知识测量的进步之间发现了统计显著的正相关(r = 0.75),可解释约56%的方差。然而,在同一组中,信念与隐性产出性知识之间存在负相关(r = -0.42),尽管不具统计显著性,这表明对语法学习中产出的积极信念可能产生负面影响。在R组中,信念与隐性接受性知识测试表现之间的相关性接近强相关(r = 0.65),可解释约42%的方差,但结果未达显著水平。

主要发现总结

由于所报告的研究结果较为复杂且不易解释,因此在此处对分析中揭示的结果进行总结是合理的,以便为下一节的讨论提供参考依据。所发现的趋势可总结如下:
1. 三种干预类型均对隐性与显性知识的产出及接受维度的发展产生了有益影响;
2. 输入强化、重铸以及二者结合的干预效果总体相当,唯一的例外是,在接受性内隐知识方面,R组的表现显著低于IER组(后测1)和IE组(后测2);
3. 在显性知识测量上的表现优于隐性知识测量;
4. 就隐性知识而言,IER组在产出性和接受性维度上的提升最为显著,而R组则未表现出显著提升;
5. 就显性知识而言,所有实验组均表现出显著进步,但IER组在延迟后测中的表现显著下降;
6. 无论是显性还是隐性知识,个体差异在产出性知识测量上的表现最为明显;
7. 在IE组中,语法学习策略的使用与接受性显性知识测量成绩的提高呈显著但负相关;
8. 在IER组中,对形式聚焦教学的信念与内隐接受性知识测量成绩的提高之间发现了具有统计显著性的正相关。

4 讨论

本研究提出了三个研究问题,分别涉及不同类型教学干预的有效性、学习效果的持久性以及语法学习策略(GLS)和对形式聚焦教学(FFI)的信念所起的中介作用。关于第一个问题,无论教学干预的类型如何(即IE、R或IER),在大多数情况下,这种干预在促进内隐与外显知识的发展方面均显示出有效性,无论涉及的是产出还是接受,这与以往大量关于形式聚焦教学(FFI)的研究结果一致(如埃利斯 2008;拉森‐弗里曼 2015;洛温 2015;纳萨吉 2015;纳萨吉 2017;纳萨吉和福托斯 2011;帕瓦拉克 2013a;帕瓦拉克 2017a),也包括那些特别关注输入强化作用的研究(如茹尔德内等 1995;拉布罗齐 2016;舒克 1994;西马尔 2009)。然而应注意的是,教学对显性知识的提升更为显著,这并不令人意外,因为参与者有充足的时间运用相关规则。此外,在内隐和外显知识的产出性测试中,个体差异比接受性维度更大,这可能表明个体差异变量,特别是语言能力倾向和工作记忆容量(参见李 2017),在此发挥了作用。同时,目前尚无法就三种教学干预方式的有效性得出明确结论,尽管有初步证据表明,以加粗形式进行的视觉输入强化,以及此类强化与重铸相结合的方式,比单独提供重铸更为有效。这可能是因为文本输入强化(如本研究所采用的形式)不仅比转瞬即逝的重铸更具持久性,而且也更显性;而重铸本身极易被误解为对所说内容的评论,而非负面证据(参见莱斯特(1998);尼古拉斯等人(2001))。还应强调的是,总体而言,IER组表现出最稳定的学习进步,这可能说明结合不同感知模式(即视觉与听觉)的重要性,也可能反映出通过文本强化和重铸使目标特征获得了更高的显著性。事实上,这一发现与先前研究结果一致,即多种强化方式的结合可能比单一干预更有效。

关于干预的短期和长期效果,也可以做出类似的评论,因为不仅大多数积极效果从即时后测延续到了延迟后测,而且在某些情况下还显示出进一步的统计显著提升(例如,IE组在隐性产出性知识方面的表现)。然而,这种效果在重铸方面则不那么明显,这再次可以解释为成功将重铸理解为负面证据存在困难(参见莱斯特 1998;尼古拉斯等人 2001)。还应注意的是,显性知识的进步比隐性知识更为明显,这一点是可以预见的,因为如上所述,参与者有充足的时间运用相关规则;此外,总体而言,产出性维度的进步远比接受性维度更为显著,尤其是在隐性知识方面。

然而,情况变得复杂的是,对照组从一开始便明显弱于所有实验组,这一问题将在本节后文加以讨论。至于最后一个研究问题,所选个体差异变量在不同类型的输入操控中的中介作用难以确立,部分研究结果令人意外且难以解释。以语法学习策略(GLS)为例,策略手段的应用似乎对目标结构的产出比接受更具相关性。但主要问题是,由于实证证据不足,这一假设只能是推测性的;即使我们考虑相关系数,其期望的显著性水平也未达到,因此GLS的中介效应似乎取决于输入强化的类型。相比之下,对形式聚焦教学的信念在接受性内隐知识方面表现出对干预效果的中介作用,但同样无法做出普遍性结论,因为这种效应仅在IER组中被观察到。鉴于研究结果的复杂性以及该领域先前研究的缺乏,这些结论只能是初步的,有待未来研究进一步验证。

在此还应提及的是该研究项目的局限性,这要求对研究结果的解释需格外谨慎。首先,在前测中,对照组与部分实验组在英语倒装结构的显性知识以及隐性知识的接受性维度上存在统计显著差异,这表明所观察到的进步可能不仅归因于实验组不同的教学干预类型,也可能是因为对照组参与者的整体水平较低。其次,R组与其他三个组的学生人数存在较大差异,这可能影响了研究结果,使得某些表现上的相对较大差异变得不具统计显著性(例如7分的前测——后测2在隐性产出性知识方面的提升)。然而,当涉及完整的小组和常规安排的课程时,这是必须付出的代价,在这种情况下,生态效度得到增强,但不同变量的严格控制则受到牺牲。最后,对于所使用的测试是否确实衡量了各类目标语知识(特别是隐性知识)也存在质疑。事实上,根据提示复述先前阅读过的文本,可能不仅依赖于隐性知识,也可能依赖于显性知识,其判断依据例如犹豫程度或停顿长度等现象,而这些现象在本研究中并未进行分析。另一方面,如上所述,显性知识与隐性知识之间的区分可能在某种程度上是虚假的,更恰当的说法可能是高度自动化的显性知识(例如,德凯泽 2010),这种知识可应用于自发交流。如果采用这一解释,问题就归结为提取速度,而在传统测试和涉及文本复述的活动之间,提取速度显然存在差异。

5 结论

本研究旨在一方面确定不同类型的基于输入的教学对英语修辞倒装习得的影响,另一方面探讨语法学习策略使用以及对聚焦形式教学的信念在此过程中的中介作用。结果表明,以理解为基础的教学干预是有效的,但其具体类型之间的差异不大;其中,视觉输入强化尤其是结合以重铸形式提供的纠正性反馈,比单纯使用重铸的教学干预更为有效。关于语法学习策略(GLS)使用以及对形式聚焦教学(FFI)信念的中介作用,实证证据尚属初步,数据显示前者可能对涉及英语倒装句子的产出更重要,而后者则可能对理解更为重要。然而,这一切似乎还取决于所采用的教学选择以及所测量的知识类型。此外,该研究项目本身存在一些缺陷,进一步增加了情况的复杂性,特别是对照组从一开始就表现不佳,或实验组之间学生人数不均衡,尤其是R组规模过小。这些因素表明有必要使用不同的样本进行重复研究,以避免本次实证调查中暴露出的一些问题。

同时,还需要开展更多研究来探讨这一领域的问题。个体差异变量在不同类型和组合的输入强化中的中介作用。例如,可以考虑其他类型的信念和语法学习策略,并可进一步研究其他个体差异变量,如语言能力倾向、工作记忆、学习风格、动机或焦虑。就干预而言,有必要探讨其更细致的类型,因为视觉与听觉输入强化均可呈现多种形式(例如不同类型的字体变化和不同类型的重铸),这些教学选择可以以不同方式组合,可能对个体差异变量的调节作用产生不同的影响。此外,延长干预时间并尝试不同的评估方式也是可取的,但需注意,同时考察内隐与外显知识的产出性和接受性维度无疑具有重要意义。此类研究显然十分必要,因为它有助于阐明在不同情况下如何最佳地实施语法教学,从而促进提升不同教学环境中外语教学的有效性。

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值