您现在的位置:普通话学习网 > 信息资讯栏目 > 普通话测试研究 > 正文

普通话水平测试研究的现状及构想

来源:普通话学习网    时间:2006-09-15

王晖:国家语委普通话培训测试中心测试处副处长,讲师,国家级普通话水平测试员。主要研究方向为近、现代汉语语法及现代汉语词汇等。主要研究成果有部颁标准《普通话水平测试大纲》(主要研制人员),论文《1994年以来普通话水平测试研究概述》等。目前担任国家语委语言文字应用“十五”规划重点项目“普通话水平测试研究”课题统筹。

普通话水平测试研究是国家语委语言文字应用研究“十五”科研规划重点资助项目,该课题是一个十分庞大的研究系统,具有特殊意义及政策性影响,国家语委普通话培训测试中心组织全国近20个省(市、自治区)语言文字工作机构和20多所高校、科研机构联合申报,目前已获批准立项。本文拟就普通话水平测试研究的现状谈谈我们的构想。

一、普通话水平测试研究现状

1994年10月,国家语言文字工作委员会、原国家教育委员会、原广播电影电视部联合发出《关于开展普通话水平测试工作的决定》的通知,普通话水平测试(PSC)自此在全国正式开展起来。2000年10月颁布的《中华人民共和国国家通用语言文字法》又通过立法手段对普通话水平测试加以强调。近几年全国各地(包括港澳地区)测试工作发展十分迅速,形成了比较科学规范的管理和运行体系,产生了广泛的社会影响。普通话水平测试研究从论证到实施,从理论到实践,经过广大专家和业务人员的辛勤努力,也取得了很大成绩。

1991年通过鉴定的由孙修章主持的国家社会科学基金项目“普通话水平测试标准”,奠定了普通话水平测试的基础。刘照雄主编的《普通话水平测试大纲》(国家社会科学基金项目,1994)是目前为止普通话水平测试最重要的研究成果。据统计(王晖,2002),1994年至2001年,全国发表关于普通话水平测试的论文约110余篇。2002年5月国家语委普通话培训测试中心主办了首届全国普通话水平测试学术研讨会,从全国选送的100余篇论文中,精选31篇进行交流。可以说,普通话水平测试研究与工作实践目前正处于互动状态,形成了一个良性循环的发展态势。但是,普通话水平测试毕竟是我国新兴而且复杂的语言测试工程,与我国的汉语水平考试(HSK)及国内外其他一些著名的语言测试相比还显得不很成熟,研究成果与语言学其他领域相比,也显得不够丰硕。在发展过程中,形势和任务迫切要求全国有关领域的专家跨领域合作,共同攻关,采用新的研究手段和方法,解决一系列突出的理论问题与实践问题。

(一)在理论研究方面,陈章太、仲哲明、刘照雄、孙修章、宋欣桥、毛世桢、王渝光、李宇明等进行了有益的探讨。但总体而言,某些具体问题研究较多,系统的基本理论研究仍显薄弱,普通话水平测试的理论框架体系尚未构建成熟。普通话水平测试作为一种独特的语言测试,不仅涉及到普通话本体等语言学及应用语言学方面的内容,而且涉及到考试的方式、方法等教育测量学方面的内容。目前,普通话水平测试的教育测量学研究显得滞后。教育测量学研究成果现在已普遍应用于一些著名的语言测试,如美国ETS的TOEFL、GRE,国内的HSK等,成为这些语言考试的重要理论支撑。张雷、杨志明、王渝光等运用当今国际心理与教育测量领域研究热点之一的概化理论(GT),对普通话水平测试进行了研究,但仍属于初步的探讨。因此,引进先进的现代教育测量理论来深入研究普通话水平测试,不仅十分必要,而且十分紧迫。随着普通话水平测试的不断深入,测试过程中一些心理因素的影响也逐步凸显,影响到测试的准确性和科学性。而该领域的有关研究,国内尚属起步阶段,相关研究很少,而且仅限于描述层面,涉及内容相对表浅和零散,未能深入而系统地揭示普通话水平测试的相关心理因素和调控策略,研究成果更谈不上很好地应用到实际测试中去。普通话与方言的对比研究,目前国内取得了很多成果,但把这些成果运用于普通话水平测试的研究,则尚未出现有影响的著述。普通话水平测试还特别需要比较研究的成果,田小琳《中国内地与香港特区普通话测试之比较研究》作了有益的探索,但总体而言,这方面的研究太少。HSK及国内外其他一些有影响的语言测试在测试理论、试卷设计、题库建设、统计分析、管理现代化、信息反馈、测试与培训互动等方面都有可资借鉴之处,深入而广泛地开展语言测试的比较研究亟需加强。

(二)在规范标准的研究方面,为了进一步规范普通话水平测试的规程,修订考试的内容、评分方法、范围,经国家语委批准,已于2002年初组成以姚喜双、刘照雄为负责人,以国家语委普通话培训测试中心业务人员为主要力量的课题组,在已有的研究基础上,进行《普通话水平测试大纲》(部颁标准)和《普通话水平测试实施大纲》的修订及研制,这是一个带有全局性、指导性的重大课题。普通话水平测试题库建设,是一项关乎普通话水平测试科学性、公平性、客观性、权威性的基础性工作。目前在上海市以及云南等其他一些省区做了实验,取得了一定的经验。但与“标准一致、难度等值、科学性强、数量足够”的建库目标尚有一定差距,甚至存在某些与现行《大纲》规定不一致之处,需要进一步改进。尽快开发与新《大纲》相匹配,适用于全国的高质量的普通话水平测试国家级题库,是摆在我们面前的重要而紧迫的任务。

(三)在施测手段方面,普通话水平测试,目前主要采用主观评测的方法,这使得测试成本很大,测试员劳动强度高,特别是测试信度受到一定局限。而目前无论在国内还是国际上,都还没有一种描述普通话水平的客观参数。近年来实验语音学、语音识别技术和计算机技术的进步,在某些方面为计算机辅助普通话水平测试评分提供了可能。所以借鉴语音分析技术、语音识别技术、现代数理统计技术,利用计算机提供出应试者的参考评分和评分的可信度级别,并进一步研究语音质量的主观评价和客观评价方法,具有重要的开创性的意义。

(四)在测试的现代化管理方面,TOEFL、GRE、GAMT和HSK等著名的语言测试都已全面利用计算机进行考试管理,其系统涵盖了考务信息管理、题库管理等各方面,技术水平和成熟度都较高,产生了相当好的经济效益和社会效益。而在我国,虽有上海、湖北、黑龙江等省市在普通话水平测试科研和管理工作中引入现代化信息技术,但出现各地独立开发,重复建设、互不兼容、技术水平参差的不协调局面。因此急需提高信息管理的规范程度,开发研制出一套技术先进、全国通用的普通话水平测试信息管理系统。
在测试基础性资源库建设方面,普通话水平测试在许多方面还是空白。语音语料库的建设,引起当今许多国家、组织和个人的密切关注,在国家高科技研究发展计划(863计划)的支持下,国内也建立了多个语音数据库。但这些语音数据库大多是面向信息处理领域。建立普通话培训和水平测试用标准语音语料库和“中介语”语音语料库,尽快填补国内这方面的空白,并为深入开展测试研究提供一个技术平台,具有特殊的重要意义。

(五)当今我们已处于一个迅速发展的信息化、网络化的时代,在普通话培训和测试中运用现代网络技术、建设开发普通话水平测试网络培训课程和实现网上测试,已成为时代的需要和广大学习者、应试者的迫切要求。这方面开发需要高额投入,但相关研究应尽快开展。计算机辅助教学(CAI)是一种崭新的现代化教育手段,自上世纪60年代出现以来得到迅速发展,加上70年代中期以来语音合成、人工智能,以及光盘特别是互联网技术的应用,更使这种新型的教学系统、教学方式日臻完善。国外语言教学注重利用多媒体手段进行教学,开发出不少适合于本国学生和外国人学习语言的教学课件。我国的外语教学在这方面做得较好,相比之下,汉语普通话教学多媒体课件的制作远远落在了后面。目前,对外汉语教学方面已有一些院校制作出版了适合于外国人学习汉语的课件产品,香港、、澳门、台湾等地区也有一些汉语普通话教学训练课件,但由于服务对象的不同和文化背景的差异,不能直接为我所用。研制和开发适用于普通话教学和涵盖普通话水平测试大纲内容,有助于各方言区各行业人士进行普通话学习和测试的教学与训练用课件,具有现实意义。

二、普通话水平测试研究的设想

针对以上状况,普通话水平测试研究课题拟从以下五个方面开展:(一)普通话水平测试理论与实践研究,(二)普通话水平测试规范标准研究,(三)计算机辅助普通话水平测试评分系统研究与开发,(四)普通话水平测试现代化管理及基础性资源库建设,(五)基于网络的普通话培训测试研究。

(一)普通话水平测试理论与实践研究

本研究旨在通过某些具体理论与实践问题的探讨,丰富普通话水平测试理论,为构建普通话水平测试研究的基本理论框架体系,提供理论和实践准备。包括以下内容:

1.普通话水平测试的概化理论研究。

(1)从教育测量学的角度研究普通话水平测试的性质和特点。包括常模参照性测试和标准参照性测试的异同、笔试和面试的异同、电脑测试及其相应的测量学问题等。

(2)从多元概化理论的角度研究普通话水平测试的误差控制问题。包括测量误差的来源及其影响程度的估计、随机误差与系统误差的控制技术、评分者的信度估计问题、题目取样的代表性问题等。

(3)从概化理论的角度研究测评工作的质量控制与成本控制问题。由于普通话测试涉及到评分者的培训、现代化技术手段的应用等问题,所以在提高测试质量的同时,必须研究测试成本的控制问题。

本研究的重点是:如何把多元概化理论的思想和方法引入到普通话水平测试之中,以便在提高测试质量的同时,有效地控制测试成本。

本研究的难点是:计算测试成本的测量学方法在理论上需要有所突破。

2.普通话水平测试的心理学研究。
普通话水平测试从根本上讲,是一种心理测量,它涉及到大量的心理学问题,本研究拟从以下几个方面进行研究:

(1)主试人的语音心理定式对测试结果影响的研究。

(2)主试人与应试人在心理上的交互作用对测试结果影响的研究。

(3)应试人心理特点对测试结果影响的研究。

(4)测试过程控制变量(测试场地安排、试卷编排、测试的辅助用具等)与因变量(测试成绩)的关系及干预策略的研究。

本研究的重点是:通过相关心理因素的分析,寻求相应的干预策略和解决途径。

本研究的难点是:(1)主试人语音心理定式的类型、成因及调控对策。(2)控制变量的相关因素及干预的实施策略、干预效果的研究。

3.普通话-方言对比研究在普通话水平测试中的应用。
拟以某些省市为突破口,在有关方言研究的基础上,通过调查其“中介语”在不同阶段上的反映,将其运用于普通话水平测试实践,以求解决以下问题:

(1)普通话水平测试在具体实施中的错误与缺陷的界定。

(2)为语调偏误的确定提供较明确的理论依据。

(3)对地方评分细则进行纠偏和改进。

(4)寻求提高普通话水平测试培训效率的有效途径。

本研究的重点是:对“中介语”在不同阶段上语言表征的描写。

本研究的难点是:对“中介语”的实验语音学分析。

4.普通话水平测试与其他的语言测试的比较研究。
本研究拟以普通话水平测试与HSK、CET、TOEFL等为比较对象,主要从以下几个方面进行研究:

(1)发展概况与研究现状,确立普通话水平测试与其他的语言测试比较研究的原则、范围和理论基础。

(2)设计原则与试卷结构对比研究。

(3)题型设计与命题技巧对比研究。

(4)统计分析比较研究。

(5)施测、管理与培训的科学化对比研究。

本研究的重点是:在全面考察普通话水平测试与HSK、CET、TOEFL等语言测试的基础上,探求其作为语言测试的普遍规律和自身特点,寻找对普通话水平测试具有借鉴价值的理论、
规律和方法。本研究的难点在于:国外语言测试理论与普通话水平测试研究的关系,确立普通话水平测试与其他的语言测试比较研究的可比参照性和理论框架。

5.其他方面的研究。除以上几个方面的研究之外,我们还将组织力量进行普通话水平测试的社会评价研究、普通话水平测试“语调”评价研究、普通话水平测试语音、词汇、语法评判原则研究等子课题。

(二)普通话水平测试规范标准研究

1.《普通话水平测试大纲》(部颁标准)和《普通话水平测试实施大纲》的研制。
贯彻《中华人民共和国国家通用语言文字法》的规定,在原有《大纲》基础上,总结八年多来普通话水平测试的实践经验,对普通话水平测试的规程、标准、方法、范围进行规范,并使之成为部颁标准。以新《大纲》为指导,研制全国通用的《普通话水平测试实施大纲》,保证新《大纲》的顺利实施。

本研究的难点是:普通话水平测试政策性强,除了测试理论问题需深入研究外,如何把握好科学性与可操作性兼顾,连续性与前瞻性并重的原则也是个难点。

2.普通话水平测试国家级题库建设。

普通话水平测试题库的建立是实现测试工作规范化的关键技术措施。《普通话水平测试实施大纲》基本定稿以后,课题组将根据新《大纲》(部颁标准)和《实施大纲》的内容和要求,以地方经验为基础,整合目前省、市级题库,编制实用程序,研制在统计语言学和教育测量学方面等值的规范试卷,建立普通话水平测试自动出题系统和数据查询系统,创建普通话水平测试国家题库。

本研究的重点是:题库系统自动生成在统计语言学和教育测量学上均等值的试卷。
本研究的难点是:目前尚没有完全适应普通话水平测试的教育测量理论和方法,题库建设的理论基础和数学模型,需要在实践中进行深入探索。

(三)计算机辅助普通话水平测试评分系统研究与开发

限于目前国内外研究水平,本项目只作单音节字词和双音节词语辅助评分系统的探索性研究与开发。

首先,建立各等级标准数字化音档库,通过不同等级样本与应试者样本的语音匹配、分析、比较,运用实验语音学方法,客观展现受试人的普通话语音面貌,借助语音识别技术,建立标准音、错误音、缺陷音的匹配模板,提供出应试者的参考评分。

本研究的重点是:普通话水平测试中错误音与缺陷音总体语图模式的分析、识别。

本研究的难点是:普通话语音变化的复杂性和多样性,使建立相应的匹配模板异常困难,技术路线也需在实验中探索。

(四)普通话水平测试现代化管理及基础性资源库建设

1.普通话水平测试信息管理系统。

鉴于目前上海、湖北、黑龙江等省市已开发适用于当地的管理系统(上海已推出第5版),积累了一定经验,本项目将以此为基础,深入了解各省市使用需求,进一步吸收最新的计算机信息技术,开发出一套技术先进,全国通用的信息管理系统,该系统将在安全性、稳定性、功能性和方便性上达到国内先进软件的标准,并依托Internet实现国家语委普通话培训测试中心与各省市普通话培训测试中心管理系统互联。本系统将包括以下几个方面:(1)报名管理(2)考试现场管理(3)证书管理(4)系统查询(5)统计分析(6)数据管理(7)系统维护。

2.普通话水平测试基础性资源库建设。

本研究拟进行普通话培训和测试用标准语音语料库的开发和“中介语”语音语料库的开发。
(1)建立覆盖全面的普通话标准语音数据库:选择经国家语委普通话培训测试中心审定的专业发音人,采用数字录音设备,录制标准语音样本,利用实验语音学方法,提取各种声学参数,通过构筑语料库技术平台,建立语音数据库。

(2)建立“中介语”语音语料库:汉语普通话“中介语”语音语料库如果全面展开必然是一个规模浩大的工程,本研究拟以上海话-普通话“中介语”语音为突破口,构筑一个技术平台,探索一套研究模式,并为将来建立更大规模“中介语”语音料库提供一个范本。

本研究的重点和难点是:设计覆盖科学合理的文本,高质量录制数据,进行语料分析和标记。

(五)基于网络的普通话培训测试研究

1.开发基于Internet的普通话多媒体教学系统。

依托中国语言文字网,严格按照教育部《现代远程教育资源建设规范》和《网络课程开发要求》,开发普通话多媒体网络教学平台(拟采用“站中站”模式),建立一个多媒体资源库和一个基于规则的适用于普通话网络教学的知识库,以实现网上的个别化教学和一定程度的智能化教学。
本研究重点:(1)多媒体资源库的建设。(2)脚本群模型(Hisc)的建立。
本研究难点:针对学习者不同情况、不同需求编写和组建大规模普通话培训脚本群。

2.多媒体普通话教学与训练课件库。

研制出一套适用于普通话教学和符合《普通话水平测试大纲》内容,有助于学习者进行普通话学习和测试的教学与训练用课件。拟制作成普通软件和CD-ROM光盘两种版本,以适应不同用户的需要。根据不同对象,拟将此研究内容分为两个部分:

(1)普通话训练课件库,针对不同方言区学习者的不同层次,研制出适用于不同方言区及不同层次水平的辅助学习软件。

(2)普通话水平测试员培训课件,主要为国家级和省级测试员培训,研制辅助教学软件。

本研究重点和难点:脚本编写和软件编程。

普通话水平测试研究是一个十分庞大的研究体系,研究内容涉及到多学科、多领域,我们将根据各子课题的研究目标,综合运用实验研究、模拟研究、对比研究、调查研究(包括问卷调查、田野调查、座谈调查)等多种研究方法,以及语音识别技术,现代数理统计技术、计算机技术、信息技术等各种技术手段,具有鲜明的理论研究与应用实践相结合的研究特点。

普通话水平测试研究课题具有重大的理论价值和实践意义。它把汉语言学基础理论研究同教育测量学、数理统计学、心理学等相关领域研究相结合,综合运用多种研究手段及先进技术,不仅会丰富普通话水平测试的理论基础,而且也可以提高语言研究的广度和深度,为汉语言学研究的现代化提供新思路和新方法。本课题研究的开展,将进一步加强普通话水平测试国家法定标准的客观性、准确性和权威性,有力地促进普通话水平测试由经典型测试向现代型测试转化。普通话标准语音语料库、“中介语”语音语料库等基础性资源库建设,对信息科学研究以及相关的应用也将产生一定的推动作用。课题研究的成果,对全国的普通话水平测试工作乃至整个推广普通话工作将起到积极的促进作用,具有深远的社会意义。

[参考文献]
[1] 《中华人民共和国国家通用语言文字法》,2000年10月31日第九届全国人民代表大会常务委员会第十八次会议通过.
[2] 香港中国语文学会普通话测试研究小组,普通话水平考试大纲(征求意见稿),1984。
[3] 中国对外汉语教学学会,《汉语水平等级标准和等级大纲》,1988.
[4] 刘导生,新时期的语言文字工作,1986.
[5] 孙修章,普通话水平测试标准的研制与实践,语言文字应用,1992.(1).
[6] 刘照雄,推广普通话的重要举措——普通话水平测试简论,语言文字应用,1997,(4).
[7] 陈章太,论普通话水平测试等级标准,语言文字应用,1997(3).
[8] 仲哲明,普通话水平测试若干问题的讨论,语言文字应用,1997,(3).
[9] 许嘉璐,普通话水平测试研究序,语文出版社,1997.
[10] 李宇明,关于普通话水平测试的思考,普通话水平测试研究序,上海教育出版社,2002 .
[11] 王晖,1994年以来普通话水平测试研究概述,首届全国普通话水平测试学术研讨会论文,2002 .5(扬州).
[12] 刘照雄主编,普通话水平测试大纲,吉林人民出版社,1994 .
[13] 于根元,二十世纪的中国语言应用研究,书海出版社,1996 .
[14] 国家语委普通话培训测试中心、《语言文字应用》编辑部合编,普通话水平测试的理论与实践,商务印书馆,1998 .
[15] 宋欣桥编,普通话水平测试员手册,商务印书馆,2000 .
[16] 刘镰力主编,汉语水平测试研究,北京语言文化大学出版社,1997 .
[17] 谢小庆 鲁新民主编,考试研究文集,经济科学出版社,2002 .
[18] 各子课题项目申请书,恕不一一列出 .

(作者:普通话水平测试研究课题组 执笔人 王晖)