摘要:基于教材和影视字幕中的会话语料,将“话题、交际图式、常用会话、常用句、交际构式、常用词”紧密结合起来,构建了一个面向汉语口语教学的分话题分图式的词、句、式、篇的综合资源库。该资源库对于汉语教学、辅助教材编写、在线汉语学习有较高的参考价值。
关键词:汉语教学;话题;图式;常用句;构式;常用词
目前,汉语教学多媒体资源库的研究成果比较丰富:理论探索方面,主要有郑艳群 (2008)、仇鑫奕 (2008) 、周小兵 (2010)等,讨论了资源库建设构想;建设实践上,熊玉珍 (2005) 、陈芳 (2003) 、郑美平 (2008) 、刘华 (2014)等建设了各种汉语教学资源库;教学应用上,主要包括各种多媒体课件和网络资源库。
近一二十年出现的构式、语块、图式理论为对外汉语教学研究提供了新思路。基于话题,构建学习者常用的交际项目的基本图式,掌握交际图式中常用的句子和词汇,可以让学习者明白什么时候什么场合(情景)应该说什么(话题)、怎么说(功能),从而更流畅、更地道地表达和交流,让学习更有针对性,更高效。
基于教材和影视字幕中的常用对话,本文结合“话题—交际图式—常用会话—常用句—交际构式—话题词簇(常用词)”等内容,构建一个面向汉语口语教学的综合的话题资源库。
例如:话题“交通出行—买票订票”的中级交际图式是“招呼—提出需求—确认信息—付费—收票”;图式“提出需求”的中级常用词语(话题词簇)“订、买、票价、机票、车票、预订、经济舱……”;中级常用句子“麻烦帮我订一张机票。我要买一张去广州的票。……”;中级常用构式“我要买[(一/二……)张]去(北京/广州/香港……)的(飞机/火车/汽车票)。”
一、相关概念
1.话题
话题是交际的核心,界定交际范围和基本内容,是交际的起点或对象,并指向交际目的。
2.常用会话
会话是指交际双方围绕一个话题完成某个交际目的的谈话过程,以句对形式出现。常用会话是完成话题功能最基本、最相关的会话。
3.常用句
交际中最常用的句子。从意义上来说,是指句子表达的内容与会话(或交际图式)相关性较高;从形式上来说,常用句生成性高,有一定框架式结构规律可寻。
4.交际图式
图式是由抽象或一般知识组成的一种知识框架、计划或脚本,是表征人类一般知识的一种心理结构。每一个完整的会话都是由一定的交际环节构成,这些交际环节组合起来即是这个话题的基本交际图式,例如购物的交际图式可以概括为“招呼—需求—推荐—功能—用途—属性—价格—数量—购买—服务—付款—发票”。
5.交际构式
交际构式是基于交际功能,从常用句中归纳的句子层面的框架型结构:
(1)骨架,与表达内容相关或自身具有一定表达意义的词语标记。
(2)空位,可替换的句子成分。
例如,常用句“我要订去北京/广州/香港的飞机/火车/汽车票。”,交际构式可概括为“我要订去……的……票。”
6.话题词簇
围绕话题实现交际功能的常用词语集合,与某一话题紧密关联的词语群。例如,“就餐”话题的话题词簇“吃饭、点菜、便宜、新鲜、味道、饭店……”
二、研究思路与流程
话题及其会话是整个研究框架的基础。整体基本思路与流程如下:
1.根据已有话题大纲和汉语会话教材,确定本文研究的话题大纲体系,并按照常用度将话题分级。
2.精选教材、影视字幕中典型的会话材料,参照话题大纲体系将会话材料按话题分类,建立“话题—会话资源库”。
3.分析各话题对应的交际图式,按常用度将交际图式分级,建立“话题—交际图式资源库”。
4.根据交际图式选取和交际相关的常用会话,按常用度将常用会话分级,构建“话题—交际图式—常用会话资源库”。
5.根据交际图式及常用会话,选取常用句子,按常用度将常用句子分级,标注其交际功能,构建“话题—交际图式—常用会话—常用句子资源库”。
6.提取常用句的交际构式,同时考察这些构式涉及的功能项目情况,构建“话题—交际图式—常用会话—常用句子—交际构式资源库”。
7.根据常用会话、常用句、交际构式,选取各交际图式对应的话题词簇,按常用度将词簇分级,构建“话题——交际图式——词簇资源库”。
三、话题库及常用会话库建设
“话题”是一个大的范畴,每个话题下面可能包含更小的话题。以“话题”为纲,通过话题来分配语料文本,使繁杂的语料清晰明确;以“话题”为点,确立各个话题的交际图式,一目了然;以“话题”为轴,分级提取常用词和常用句,针对性强,学习效率高。
3.1话题库建设及排序分级
我们总结了15套49册汉语教材、5个情景功能类教学大纲、4个话题表中的话题,经过对比分析、专家修订后,构建一个含5大类,35个话题及54个子话题的话题库。同时,结合话题的总频次及其在各教材中的平均位置,将话题按常用度排序,并标注其等级[2]。
表1 话题库(生活类话题示例)
话题
|
子话题
|
频次
|
平均位置
|
所含等级
|
人际交往
|
问候
|
16(高)
|
1.10
|
12
|
介绍
|
15(高)
|
1.60
|
123
|
约会
|
15(高)
|
7.20
|
123
|
打电话
|
13(中)
|
8.63
|
123
|
聚会
|
13(中)
|
12.11
|
123
|
拜访接待
|
10(中)
|
13.14
|
123
|
网络交际
|
4(低)
|
16.00
|
3
|
购物
|
购物
|
16(高)
|
5.60
|
123
|
就餐
|
就餐
|
14(高)
|
8.88
|
123
|
交通出行
|
问路指路
|
14(高)
|
8.91
|
123
|
乘坐交通工具
|
15(高)
|
123
|
天气
|
天气
|
15(高)
|
10.40
|
12
|
健康
|
生病
|
14(高)
|
12.57
|
123
|
就医
|
15(高)
|
123
|
买药
|
|
|
23
|
旅游
|
旅游
|
16(高)
|
12.90
|
123
|
运动
|
运动
|
16(高)
|
13.40
|
123
|
时间
|
时间
|
10(中)
|
4.86
|
12
|
银行业务
|
银行业务
|
12(中)
|
9.29
|
123
|
住所
|
外出住宿
|
12(中)
|
16.53
|
123
|
租房
|
6(低)
|
23
|
买房
|
5(低)
|
3
|
休闲娱乐
|
影视
|
10(中)
|
14.33
|
23
|
音乐
|
-
|
3
|
美容保健
|
-
|
3
|
婚恋
|
恋爱
|
9(中)
|
19.62
|
23
|
婚姻家庭
|
13(中)
|
23
|
相亲
|
-
|
-
|
3
|
求助
|
请求
|
4(低)
|
11.50
|
123
|
报警
|
23
|
呼救
|
12
|
3.1常用会话库建设及分级
会话是口语交际中最常见的形式,也是初中级阶段留学生接触最多的文本形式。常用会话是完成话题功能最基本、最相关的会话。
3.1.1常用会话库建设、标注
本文收集的会话材料,一方面是建立话题库和选取常用句、常用词的基础,另一方面在话题分类后可以直接作为基础会话资源应用。
在上文的15套49册汉语教材之外,我们再选取了6套13册专门的汉语会话教材,对这些教材,人工将其会话类课文归类到话题库中的具体子话题,共获得636个会话。并且,我们人工从中国现当代生活题材的影视(139部电影、76部电视剧及纪录片、5部微电影和6部宣传短片)中,选取子话题对应的影视会话片段共1845个。二者总计2481个会话。
对这些会话,再由专家精细筛选,删掉了一些话题代表性不强[7]、难度偏大、重复度高的会话。最终,共保留1615个常用会话,这些常用会话是完成话题交际功能最典型、最相关、最常用的会话。同时,对这些会话标注了标题、关键词、重点词语、重点句子等信息。
3.1.2常用会话按初中高分级
1615个常用会话还需要按常用和难易程度分为初中高三级,方便不同汉语水平的学习者按顺序学习,最常用的、容易的先学。
初中高分级的具体操作方法如下:
1.采用“会话片段常用度排序”算法 ,对1615个常用会话统一计算其常用度,在各自的子话题中将其按常用度从低到高排序;
2.专家依据此排序和教学经验,同时参照《汉语国际教育用音节汉字词汇等级划分》中的“词汇等级划分”(下称为“词汇等级”),先人工观察初中高三级的常用度分级标志数值,例如,多次实践后,发现常用度低于200的绝大多数可分为初级,200到400之间的大多为中级,高于400的为高级;
3.依据分级标志数值(-200-400-)初步分级后,重点对处于分级标志数值左右边界的会话进行人工干预,例如,对常用度处于180到220,380到420范围的会话,重点干预;
4.人工干预后,再请三个汉语口语教学经验丰富的老师对全部会话的分级情况进行检查,对于那些老师和专家之间分级有分歧的会话,重点商讨干预。
最终,初级话题常用会话共580个,中级话题常用会话共566个,高级话题常用会话共469个。基本上,每个二级子话题都有10个以上的常用会话。
“日常生活-购物”初、中、高分级的常用会话示例如下:
表2 初、中、高分级的常用会话示例
初级会话
|
中级会话
|
高级会话
|
<T>
怎么卖呀,这个
<|T>
<K>
购物 询问
<|K>
<C>
怎么卖呀,这个?
十八。
这个呢?
这个呀,这个二十八。
这个二十八?
对呀。
<|C>
<W>
卖
<|W>
<S>
怎么卖呀,这个?
<|S>
|
<T>
怎么卖
<|T>
<K>
询问价格
<|K>
<C>
怎么卖?
六块一斤。
六块呀。
来,看一看啊。
便宜卖啦,便宜点卖啦。
会不会挑呀?
两头大的就是好的。
就这个,这个可以。
就这些。
够了。
够了。
十六块。
<|C>
<W>
卖 块 斤 便宜卖 挑
<|W>
<S>
怎么卖?
<|S>
|
<T>
买茶具
<|T>
<K>
购物 付款 打折
<|K>
<C>
这套茶具您要是满意的话,我就给您包起来了?
包起来吧。你们正在打折,是不是?
对,茶具都打8折。这一套原价888,打折后的价格是710元。
您拿着这张小票去交钱,收银台在那边。
您好,一共是710元。
这儿可以刷卡吗?
可以刷卡。麻烦你给我开张发票好吗?
付款单位写哪儿?
写“个人”就行。
<|C>
<W>
打折 价格 小票 收银台 刷卡 发票 付款 元 一共 交钱
<|W>
<S>
您好.一共是710元。
这儿可以刷卡吗?
麻烦你给我开张发票好吗?
<|S>
|
四、交际图式资源库建设
人们常常涉及的交际活动存在一个基本的图式,这个基本图式由交际活动的不同环节构成。运用图式理论,一方面可以在学习某一话题时有意识地培养学生的整体交际观念,另一方面可以分解会话交际活动的环节,并对每一个交际环节常涉及的内容进行研究,这样可以更合理地教授或编排某一话题的会话材料。
在具体的汉语教学中,归纳汉语教学中话题的交际图式和具体环节,有助于汉语学习者在大脑中组织成一个有层次且相对独立的“知识块”,对这些知识块的运用,不仅符合学习者的认知需求,减轻他们记忆负担,还可以使学习者流畅、完整而且地道的完成交际任务;另外,对每个交际图式的掌握也有助于学习者理解汉语特定话题下的语篇。
4.1交际图式
在话语中“即使没有提到所有的细节,听话者只要具备这种交际图式或认知脚本,就能根据听到的人和事物及其对认知图式或认知脚本的知识来重构事件”。
各种社会交际图式并不是孤立的,而是相互联系、共同作用的:
首先,当处于某特定情况时,我们会尽力识别是否认识该情况,这就需要从记忆中追寻一个甚至几个情景图式。接着,当类似于当前情况的情景图式找到之后,该图式会提出一个要实现的目标,目标确定后,又会进一步寻求完成这一目标的策略图式。当策略图式选定之后,程序图式将会提供一系列的行为步骤指导我们的行动。并且,在行动过程中,我们又会进一步判断情况,选择情景图式,从而在更具体的情况下依据与之更相应的图式来行动。
情景图式是对社会交际的情境场合以及相应的适当行为的认识。比如,一看到“医院”这个场景,我们会马上联想到“白大褂、病房、医生、病人、护士”等。
程序图式和情景图式紧密联系的,是对经常发生的事件的有序组织的认识,包括采取恰当步骤和行为规则。比如有上医院就诊经验的人,对如何挂号、诊治、检查、打针、缴费的过程比较熟悉。
策略图式是对解决问题的策略办法的认识,往往和专业相联系。比如,商务类话题“海关、商务谈判”等,专业性很强,是典型的策略图式。
一般来说,生活类话题往往是情景图式和程序图式,而专业类的话题则多为策略图式。
4.2交际图式的分级
在实际交际中,交际图式并非一成不变,每个大环节也包含若干小环节,任何一个小环节都可能会随语境等因素发生变化。例如,“外出就餐”的基本图式结构是“商定餐馆和菜系→预订餐位→前往就餐地点→选择座位→点餐→用餐→评价→结账→打包”,但是由于某个参数发生变化,图式结构也会相应有所变化。如,很多情况下,不一定需要打包。因此,每个话题经常涉及的交际环节就是这个话题的基本图式,基本图式还可衍生出一些变式。
张和生(1997)认为,在会话课教学中对学生进行口语交际要有意识地注意到口语交际在内容上的层次性。比如“购物”,低层次的交际不外是询问价格,讨价还价等;高层次的交际就可能包括讨论商品性能质量,评论售货员服务态度等,所以在课堂设置交际语境时还要充分考虑到交际内容的层次性。
因此,从层次性角度考虑,交际图式还可以根据必要性、繁简难易程度的不同,又分为初级图式、中级图式和高级图式,例如,初级图式是满足最基本交际需求的图式。
4.3交际图式库建设
生活类话题与留学生的日常生活密切相关,是基本的、主要的话题。本文以“日常生活-购物”类话题为例,对各话题的交际图式进行构建和分析说明。“日常生活-购物”是典型的程序图式。
表3 “日常生活-购物”图式
编号
|
交际环节
|
说明
|
所在等级
|
1
|
招呼
|
卖方主动招揽顾客
|
初、中、高
|
2
|
需求
|
买方提出购物需求
|
初、中、高
|
3
|
推荐
|
买方请求推荐或卖方进行推荐
|
中、高
|
4
|
属性、用途、功能
|
物品的颜色、大小、用途等
|
中、高
|
5
|
试穿、试用
|
询问是否可以试穿、试用等内容
|
中、高
|
6
|
评价
|
对物品各方面或服务的评价
|
高
|
7
|
价格
|
询问价钱,讨价还价,优惠等
|
初、中、高
|
8
|
购买
|
买方决定购买
|
中、高
|
9
|
会员卡
|
询问或提供会员卡
|
高
|
10
|
保修/质期
|
询问保修或保质期限
|
高
|
11
|
售后服务
|
询问售后服务
|
高
|
12
|
付款
|
付钱和找钱
|
初、中、高
|
13
|
发票
|
索要发票,开发票
|
高
|
14
|
包装
|
买方请求包装或卖方提供包装
|
高
|
“购物”话题交际环节多,环节难易程度不一,所以构建的图式也比较复杂。根据交际环节的多少和难易程度的不同分别建立了初级图式、中级图式和高级图式。由高级图式我们可以看出,购物的完整交际环节一共有14个。
对于54个子话题,共构建了123个(有的话题没有全部三级)交际图式库。
五、常用句资源库构建
常用句是在特定语境下最常用的句子,具有极强的实用性和工具性,能够达到“即学即用”或“即获即用”的效果,因此常用句被广泛运用于写作和口语教学这两个领域。
5.1常用句选取标准
常用句是指在一个话题的会话中,与话题相关度高,经常出现,完成交际功能必不可少,并且句式结构相对简单明了的句子。
1.话题相关度高
如在“旅游—景点介绍”话题中,“杭州是著名的旅游胜地”这种和介绍景点紧密相关的句子就应该是常用句,按照交际图式对应常用句的方法来保证话题相关性。
2.常用度高
即话题的交际情景中必然且经常会说到的句子,如“我想订一张明天上海飞襄阳的机票”,在“乘飞机—订机票”话题中必然会出现,且经常出现。
3.句式简单、结构明了
交际中,句式简单、结构明了的句子更容易被掌握,这符合语言学习的经济性原则,在有表达意思一致的多个句子可选的情况下,应该选择句式相对简单的句子作为常用句。
5.2常用句选取方法
在上文建设的会话库中,每个常用会话片段都已经由专家人工挑选出会话中的句子作为重点句子。根据话题中的交际图式,将句子集结到每个交际图式中,形成常用句的初步句库。例如,“日常生活—购物”中部分重点句子:
表4 对应交际图式的重点句子(举例)
交际环节
|
例句
|
序号
|
精选
|
分级
|
功能
|
招呼、询问
|
要什么?
|
A1
|
√
|
初
|
询问
|
您要买什么?
|
A2
|
√
|
初
|
询问
|
想买什么?
|
A3
|
√
|
初
|
询问
|
先生,想买点儿什么?
|
A4
|
√
|
初
|
询问
|
您需要点儿什么,小姐?
|
A5
|
|
初
|
询问
|
欢迎光临,您好。
|
A6
|
|
初
|
招呼
|
试穿、试用
|
我想试试那个。
|
B1
|
√
|
中
|
请求
|
您可以试一试。
|
B2
|
|
中
|
请求
|
我可以试试那件衣服吗?
|
B3
|
√
|
中
|
请求
|
我试一下那双白色儿的鞋,行吗?
|
B4
|
√
|
中
|
询问
|
您穿多大号的?
|
B5
|
√
|
中
|
询问
|
麻烦你给我拿一件这种衬衣,我试一下。
|
B6
|
√
|
中
|
询问
介绍
建议
|
这件衣服是意大利的新款,要不要试一下?
|
B7
|
√
|
高
|
请求
|
价格
|
多少钱?
|
C1
|
√
|
初
|
询问
|
一斤多少钱?
|
C2
|
√
|
初
|
询问
|
多少钱一斤?
|
C3
|
√
|
初
|
评价
|
一共多少钱?
|
C4
|
√
|
初
|
询问
|
您好,一共是710元。
|
C5
|
√
|
初
|
询问
|
便宜点吧。
|
C6
|
√
|
初
|
询问
|
太贵了。
|
C7
|
√
|
初
|
询问
|
能不能便宜点儿?
|
C8
|
√
|
初
|
询问
|
你们有便宜一点儿的吗?
|
C9
|
√
|
中
|
请求
|
这条裙子怎么卖?
|
C10
|
√
|
中
|
告知
|
打折吗?
|
C11
|
√
|
中
|
询问
|
能不能给我们打个折扣?
|
C12
|
√
|
中
|
询问
|
在常用句的初步句库中,对候选的重点句进行人工筛选和校对,删除代表性不强的句子,增补某些交际环节所缺乏的句子。
例如,A6句子在很多话题中经常用到,话题代表性不强,A5常用度不高,一般不这么说,B2有点绕,一般直接说“可以/你试吧”,C2较少用,C3口语性更强更常用,C4和C1可以合并。
5.3常用句分级
5.3.1分级依据
常用句有难易之分,分别适用于初、中、高三个学习阶段。对其进行分级处理,有利于对不同水平的学生进行针对性强的教学。
分级的依据有两个:
1、话题和交际图式本身的难易程度;
例如,表4中的“价格”交际图式横跨初中两个级别,其常用句相应也包含两个级别,而“试穿、试用”只有中高两个级别,其常用句只能是中级或高级的。
2、句子内容和表达的难易繁简程度;
我们通过“句子常用度计算”来辅助进行判断。
影响句子常用度的因素主要有:句长;句中所用词语常用度的均值;句中常用度最低词语的常用度。句子常用度可通过这三个因素来综合模拟,第二个因素最为关键。
5.3.2分级过程
1.对句子统一计算其常用度,在各自的交际图式中将其按常用度从低到高排序;
2.依据此排序和教学经验,人工观察初中高三级的常用度分级标志数值,例如,多次实践后,发现常用度低于20的绝大多数可分为初级,20到40之间的大多为中级,高于40的为高级;
3.依据分级标志数值(-20-40-)初步分级后,重点对处于分级标志数值左右边界的句子进行人工干预,例如,对常用度处于18到22,38到42范围的句子,重点干预;
4.人工干预后,再请两个汉语口语教学经验丰富的老师对全部句子的分级情况进行检查干预。
最终结果的示例如表4。
5.4常用句的交际功能标注
功能指的是言语行为在一定的情景中所能完成的交际任务,通俗的说,就是用语言做什么。常用句在特定的话题情景中所起到的作用,我们称之为交际功能。考察不同话题中高频出现的交际功能类型,把同一功能的常用句收录在一起,建立“交际功能—常用句”的对应关系和检索目录结构,方便使用。
常用句交际功能类别和范畴的确定,需要从汉语教学与教材的实际出发,兼顾功能项目的实用性。我们主要参照《对外汉语教学初级阶段教学大纲》(杨寄洲,1999,北京语言大学出版社)、《对外汉语教学中高级阶段功能大纲》(赵建华,1999,北京语言大学出版社)来为常用句标注交际功能。
最终结果的示例如表4。
六、交际构式资源库构建
6.1构式理论与框架结构
构式理论中的构式是形式和意义的派对,构式的研究内容从形式上分为实体构式和图式构式。目前,比较关注的是短语、句子层面的构式研究。
句子层面的构式研究属于图式构式的研究,图式构式的特点就是半开放的,存在可填充的空位部分,如苏丹洁(2010)。从构式-语块理论在教学中的运用可以看出,构式理论是从语义上对句子表达进行语块分析,这些语块组合在一起成为语块链,也就是构式。张怡春(2009)认为“语言中各种规约化的‘形式—意义功能’结构体都是构式”;周健(2005)提出要关注常用的交际功能语块;覃俏丽(2009)认为维持各种语言功能的句式也是语块的组成部分,这些句式格式相对固定,可根据不同的话题需要嵌入相应的词语。
在汉语教学研究和大纲中,也常常会涉及到一些框架结构,有短语层面的也有句子层面的。比如朱林清等(1987)使用了“格式”的说法;刘英林(1996)列举了一些“固定格式”、“口语格式”;施春宏(2011)谈到了如“为……起见”之类的“框架式结构”。还有其他诸如格式型句式、句型式套语、嵌入型格式等称法。本文研究的是句子层面的框架结构。
6.2交际构式界定
受构式理论启发,本文把这些交际中的句子框架结构称之为“交际构式”。交际构式是基于交际,从整个句子表达中概括出来的框架结构。一个完整的交际会话总是围绕一个或几个话题进行,围绕话题有一些经常使用的句子表达,而且这些句子往往有一个可套用的框架结构,本文提取了这些句子里的框架结构,称之为“交际构式”。
交际构式由两部分组成,一部分是和表达内容相关或自身具有一定表达意义的词语标记,一部分是句子空位成分,空位部分可以进行填充替换:
(1)骨架,与表达内容相关或自身具有一定表达意义的词语标记。
(2)空位,可替换的句子成分。
例如“我要订去北京的火车票。”,其交际构式可概括为“A要订去B的C。”,A可以用人替换,B可以用地方替换,C可以用车票、机票类替换。
6.3交际构式提取
在上文构建的基于话题的交际图式常用句句库基础上,对常用句句库中那些结构清晰、有明显空位部分可以替换、词汇部分是开放的常用句子进行交际构式概括;同时,参考、借鉴了杨寄洲(1999)主编的《对外汉语教学初级阶段教学大纲》、赵建华(1999)主编的《对外汉语教学中高级阶段功能大纲》,对常用句提炼出的交际构式进行功能标注,且举例说明交际构式的空位部分可供替换的词语。如,“你能推荐一个招牌菜/热菜/凉菜吗?”这个常用句的交际环节是点菜,交际构式是:“你能推荐一个……吗?”,表示咨询、请求推荐功能。空位部分可以由“饮料、肉菜”等有关饮食的词语进行补充。
通过这种方法,不仅可以建立 “话题—交际图式—常用会话—常用句子—交际构式”五者之间的联系,让学习者在学习过程中,根据话题选择适合自己的会话以及常用句,并通过交际构式的掌握达到举一反三、熟能生巧的目的;而且通过功能标注,让学生们更清楚了解这些语句的用法,明白这些语句的使用场合,进而说更地道更自然的汉语。
表5 交际构式示例(购物,举例)
例句
|
交际构式
|
用法
|
交际
环节
|
功能
|
C3-01
|
……有多大?
|
物品:定指,如这种冰箱
|
属性
|
询问
|
C10-01
|
有……的吗?
|
物品某方面属性:如浅色、大一点儿
|
属性
|
询问
|
C10-06
|
你喜欢什么……的?
|
物品某方面属性:如颜色、款式
|
属性
|
询问
|
C10-12
|
A有多B?
|
A:物品或物品某方面,如这件衣服、颜色B:对A 的描述,如大、深
|
属性
|
询问
|
C10-13
|
没有比A更B的了。
|
A:物品:定指,如这件B:某方面属性的描述,如便宜、漂亮
|
属性
|
强调
|
C2-08
|
就……好了。
|
价格
|
价格
|
决定
|
C9-02
|
……多少钱?
|
物品
|
价格
|
询问
|
C9-04
|
A元一B。
|
A:价格;B:计量单位,如斤、副
|
价格
|
说明
|
C10-05
|
最低要……。
|
价格,最少的价格
|
价格
|
强调
|
C10-06
|
能……点儿吗?
|
讨价还价,便宜、少、优惠
|
价格
|
询问
|
C7-05
|
一共是……。
|
金额:如五十元
|
付款
|
说明
|
C7-06
|
找你……。
|
金额:如五十,二十元
|
付款
|
说明
|
C7-05
|
我要发票,这是……。
|
单位,如暨南大学
|
发票
|
说明
|
|
|
|
|
|
|
七、话题词簇资源库构建
7.1常用词语与话题词簇
客观上,判断一个词语是否常用,要根据其使用频率来判断。比如,“多少”、“钱”、“买”这几个词语在进行购物交际时,基本上每次会话都会用到,出现频率相当高,这三个词是“购物”话题下的常用词。
话题词簇就是围绕话题交际的常用词语集合,与某一话题紧密关联的词语群。例如,“就餐”话题的话题词簇“吃饭、点菜、便宜、新鲜、味道、饭店……”。
本文研究的常用词都是基于话题分类下的具体会话的,所以我们将从意义和频率两个方面来定义常用词的选取标准。
1、意义相关:词语表达的意义与话题会话的交际内容密切相关。
2、频率较高:出现频率较高。当然这个频率值是相对的。
7.2话题词簇提取方法
7.2.1抽取常用会话中分话题分图式标注的重点词语
上文建设的1615个常用会话标注了话重点词语等信息,并且按常用和难易程度分为初中高三级。例如,表2中初、中、高级对应的重点词语分别是:
1、卖;
2、卖、块、便宜、斤、买、挑;
3、打折、价格、小票、收银台、刷卡、发票、付款、元、一共、交钱
同时,重点词语按交际图式进行了分类:
表6 “日常生活-银行”重点词语
交际环节
|
等级
|
常用词
|
取号、叫号
|
中级词
|
拿号、等候、取号、叫号、窗口、办理
|
招呼
|
基础词
|
请问、帮、业务、办理、你好
|
要求
|
基础词
|
换钱、取钱、开立、活期、存款、账户、兑换、现金、存钱、美元、人民币、定期
|
中级词
|
提钱、零钱、开户、外币、贷款、申请、换钱、存、银行、汇、汇款、销户
|
高级词
|
支票、自动取款机、储蓄
|
出示证件
|
基础词
|
护照、身份证、社会保障卡
|
中级词
|
出示、证件
|
办理
|
基础词
|
兑换、取、存、换、开立、账户、美元、人民币、单子、汇款、利息、定期、活期、存款、密码、多长时间、取、密码、输入、兑换率、储蓄、结算
|
中级词
|
自动、转存、
|
高级词
|
基金、手续费、销户、注销、兑换率、年利率、到账、销户
|
填表、签名
|
基础词
|
签字、签名、这儿、右下角、填写、表格、
|
中级词
|
支票、没问题、核对
|
致谢
|
基础词
|
谢谢、再见
|
将这些重点词语按话题分级别汇总去重(删掉了“多长时间、没问题”),同时,将汇总后的词表按照“词汇等级”进行分级排序,如下。
一级:请问、帮、办理、存款、现金、美元、人民币、定期、护照、身份证、取、存、换、输入、这儿、谢谢、再见、办理、存、银行、证件、自动
二级:业务、账户、汇款、利息、密码、签字、签名、表格、等候、窗口、外币、贷款、申请、汇、基金、手续费
三级:兑换、储蓄、填写、零钱、出示、支票、核对
四级:活期
纲外词:你好、换钱、取钱、开立、存钱、社会保障卡、单子、兑换率、结算、右下角、拿号、取号、叫号、提钱、开户、销户、转存、自动取款机、注销、到账
7.2.2分话题会话集的词语领域聚类
词语聚类的核心原理是利用词语在不同话题类别的会话集中分布的差异性来计算词语对于该话题的贡献度。比如,虚词(如“的、我们、在”)在不同话题会话集中的频率几乎一样,散布均匀;而某些词语(如“银行、人民币、账户”)在“日常生活-银行”话题的会话集中出现的频率会远高于它们在其它话题会话集的频率,它们是“日常生活-银行”中的领域词语。
在上述54个子话题中,利用该聚类原理聚类出54个话题的词语,得到54个词语表。
例如,“日常生活-银行”话题聚类词表(按权重降序排列,列出前150条),按“词汇等级”分级排序,如下:
一级:风险、费用、资金、数、根据、职工、证明、太太、状况、调查、岁、笔、工资、元、需要、计划、优势、足够、交易、方法
二级:汇率、立、金额、投资、其余、外汇、信用、股票、利润、咨询、填、代理、取款、评估、限制、带有、以及、产品、发放、标志、理财、现有、拥有、主管、回报、熟悉、扩大、推出、跌、地址、支付、是否、至、更新
三级:职员、利率、存折、率、换成、兑现、董事会、信贷、货币、不定、抵押、业绩、独家、硬币、财力、偿还、住址、未
四级:英镑
纲外词:营业员、帐户、想开、信用证、分之、资信、户头、借款、旅行支票、郑、申请表、牡丹卡、中国银行、零、认购、兑、投标、存入、余额、佣金、比率、澳元、金砖、车厂、王府井、抵押品、存款单、夺命、林、取向、融通、一元、额度、单据、法郎、填表、西安、代发、联、限额、机、厘、服务员、欧
以话题的领域特征为依据,人工删除一些不符合构词规范、日常常用、不属于话题或话题代表性不强的词语。例如,“分之、车厂、一元……”,明显不是词;“根据、状况、需要、优势、足够、方法……”是常用功能性词语;“产品、标识、主管、董事会、业绩、服务员、职员……”,在其他话题中更具代表性,因此,将其保留在其他话题词表中,本表中删除。
7.2.3词语人工干预和重分级
将上文7.2.1和7.2.2两节中的分级词表合并,同时,人工进行干预,删除了如下一些词语:
换钱、取钱、借款、风险、数、证明、请问、帮、护照、这儿、谢谢、再见、自动、咨询、代理、取款、评估、回报、跌、业务、等候、贷款、率、换成、财力、偿还、核对、帐户、资信、旅行支票、牡丹卡、中国银行、零、认购、投标、存入、澳元、抵押品、存款单、融通、法郎、填表、代发、限额、机、厘、你好、开立、存钱、社会保障卡、兑换率、右下角、拿号、取号、叫号、提钱、转存、自动取款机、到账
主要是一些非词的短语,如“换钱、取钱、借款、存钱、取款、提钱、右下角……”,以及主题性不强的词语,如“风险、证明、请问、帮、护照、这儿……”等。
增加了一些词语,如“额、金融、到期、资、收益、资产、担保、信托、柜台、转账、ATM机、证、银行卡……”。
同时,基于词语的原有“词汇等级”的分级,考虑到在实际生活中的常用性,人工将所有词语重新分为初、中、高三级:
初级:元、钱、美元、取、人民币、定期、证、办理、现金、银行、身份证、存、证件、银行卡、换
中级:笔、交易、英镑、费用、申请、签字、资金、工资、金额、余额、出示、签名、窗口、汇、兑、填写、柜台、比率、支票、填、单子、硬币、汇款、兑换、密码、输入、表格、账户、利息、储蓄、利率、手续费、零钱、外币、开户、申请表、转账、存折、ATM机、活期、支付
高级:基金、投资、发放、额、利润、金融、到期、兑现、单据、联、结算、资、收益、资产、信用、货币、注销、股票、担保、额度、信贷、佣金、户头、外汇、汇率、营业员、理财、抵押、信托、信用证、销户
对于54个子话题,共构建了123个(初中高三级,有的话题没有全部三级)话题词簇库。去重后总共2389个词条。
七、结语
在对外汉语教学中,常用词语和常用句子的教学至关重要。本文以教材会话、影视字幕文本为语料基础,将话题、常用会话、图式、构式、常用词和常用句紧密结合起来,构建一个面向汉语口语教学的综合资源库,该资源库包含大规模的分话题分图式的词、句、式、篇教学资源。
该资源库对于指导留学生交际学习,辅助教师汉语教学和教材编写有一定的意义,也可以运用到汉语网络在线学习和手机移动学习中去。
本文还有很多不足,例如:会话语料收集不全面,话题的会话材料分配不均匀;常用词和常用句的选取和分级存在主观性,等等。
|