〇、引言
0.1《马氏文通》出版至今已整整一百年了。《马氏文通》的问世不仅标志着汉语语法学的产生,也标志着中国现代科学意义上的语言学的诞生。从此,中国语言学不断受到国外语言学思想和理论的影响,不用说现代汉语语音学、现代汉语词汇学、现代汉语语法学、现代汉语语义学等都是在国外语言学的思想和理论的影响下产生和不断发展的,就是中国传统的小学――文字学、音韵学、训诂学也深受国外现代语言学的思想和理论的影响,因而在研究思路上和研究方法上有所变化。当然,受影响最深、发展最快的还是汉语语法学,尤其是现代汉语语法学。特别是八十年代以来,现代汉语语法研究无论是在对语言事实的挖掘、描写上,也无论是在理论和方法的探讨上,也无论是在应用上,都有很显著的成果。这一点,已有不少论著谈到过。[i]现在正处于世纪之交,在这样的时刻,冷静地思考一下现代汉语语法研究将面临什么样的挑战,面对挑战我们该采取什么对策,这是很需要的。
0.2 汉语语法研究所面临的挑战,有的是来自应用方面的,有的是来自理论方面的。从应用方面说,挑战来自两方面:一是对外汉语教学;二是中文信息处理。从理论方面说,挑战也来自两方面:一是迫切需要对种种语法现象作出理论上的解释;二是信息时代的到来,迫切要求我们从认知的角度来探索人类的语言机制。下面分别说明。
一、来自应用方面的挑战
1.1 大家都知道,以往的现代汉语语法研究和汉语语法教学,主要是两个目的,一是为了提高汉族人的语文修养,防止在写作中出现这样那样的语法毛病;二是为了搞清楚现代汉语语法的面貌,以建设汉语语法学。为了第一个目的,我们从中学开始就要在语文课里给学生讲些语法。这种语法教学主要是让学生初步有一些语法方面的知识,以利于学生的阅读与写作。对学生来说,老师讲的语法规则听了就听了,至于老师讲的语法规则对不对,全面不全面,都不怎么考虑,更不会按老师讲的语法规则去说话。为了第二个目的,前人着实对现代汉语语法作了不少研究和探索,但一般采用归纳法,其研究思路一般都是从正面考虑问题。这种研究也能而且也已经发现不少语法规则。
对外汉语教学,面对的是外国学生或外族学生,这跟面对汉族学生的汉语教学不同。外国学生或外族学生对汉语原先是一无所知,老师怎么教,他们就怎么学,就怎么说,而且本能地要按老师讲的语法规则去类推。可是一类推就出错。就拿处所宾语来说,不少语法论著都把“吃食堂”、“吃馆子”里的“食堂”、“馆子”分析为处所宾语。从事对外汉语教学的老师在谈到这类“述宾结构”(或说“动宾结构”)时,常常会这样说:
老师的话不能说不对,但学生的理解与思考往往是老师所没有预料到的。既然说“吃食堂”就是“在食堂吃饭”,“吃馆子”就是“在馆子里吃饭”,那也就是说,“在食堂吃饭”、“在馆子里吃饭”可以分别说成“吃食堂”、“吃馆子”。外国学生这样一想,就类推起来,结果说出了下面这样的病句:
为什么“在食堂吃饭”、“在馆子里吃饭”可以分别说成“吃食堂”、“吃馆子”,而“在勺园七号楼餐厅吃饭”、“在前门的全聚德吃饭”不能说成“吃勺园七号楼餐厅”、“吃前门的全聚德”?这就很值得我们思考:第一,“吃食堂”、“吃馆子”里的“食堂”、“馆子”到底是不是处所宾语,需从新加以考虑。第二,在“吃食堂”、“吃馆子”这类说法里,对充任宾语的词语有什么限制没有?第三,“吃食堂”、“吃馆子”这类说法在什么场合,也就是说在什么语境下才能用?再如,陆俭明、马真(1985)在十多年前就提出了这样一个来自对外汉语教学中所碰到的问题:“※他这样做是合情合理。”不能说,因为后面缺少了跟“是”呼应的“的”;可是有时前面用了“是”后再出现“的”,句子反而不能说了,譬如“※他这样做是偏听偏信的”里的“的”必须删去,得说成:“他这样做是偏听偏信。”这为什么?十多年过去了,至今未见有说清楚这个问题的论文。再如,动词后如果既有趋向补语又有宾语成分,那么趋向补语和宾语的次序该怎么样?也早就提出来了,虽然已有一些学者对这个问题进行了探讨,并对不同的语序从多方面进行了解释。[ii]但还存在问题:一是不周全,不严密;二是缺乏可操作性。所以至今仍是对外汉语教学中的一个难点。类似这样的问题,在对中国汉族学生的语文教学(包括语法教学)中是不大可能提出来的。
1.2 以往的语法教学和语法研究,即使包括对外汉语教学及其相关的研究在内,面对的都是人,总起来说是要解决人与人之间的交际问题。碰到问题,即使是对外国学生,适当地指点一下,解释一下,也就过去了。现在的情况则发生了很大的变化。我们知道,作为人类文明的历史,已经经历了两个大的时代,一个是农业时代,那个时代以努力开发维持人最起码的生存条件的物质资料为主要特点;一个是工业时代,那是从英国产业革命开始的,那个时代以开发能源资源、实现体力劳动机械化为主要特点。现在则又进入了一个新的时代,那就是信息时代。进入信息时代应该从什么时候算起,说法不一。有的说应该从四十年代后期(1946年)美国宾西法尼亚大学(Pennsylvania University)研制出第一部“电子数字综合计算机(Electrical Numerical Integrator and Calculator )”开始,有的说应该从八十年代广泛使用个人电脑开始,有的说应该从九十年代建立起英特网(internet)开始。这个我们暂且不去管它,总之现在进入了信息时代。这个时代将以进一步开发计算机,以便进一步减轻人的体力劳动并逐步减轻人的脑力劳动为主要特点。九十年代开始更明确提出了建造信息高速公路、研制智能计算机的任务。而要建造信息高速公路,研制智能计算机,离不开语言学。从报章杂志的报道看,当今世界上已形成了三个研制智能计算机的中心,一个是美国,他们力图建立两个新一代的智能系统来处理自由文本军事信息,以建立起新的国家安全防卫系统;一个就是日本,日本要建立超巨型信息处理中心,决心成为世界上最大的信息商贩;一个是欧洲共同体,他们准备研制认知代理人,其第一步为认知代理人提供准确而可靠的认知机制。无论哪个中心,他们在着手进行研制智能计算机的任务中,都不约而同地以语言信息处理为中心。在他们的研制队伍里既有计算机科学方面的专家,也有语言学家。其实在七十年代就有人预见,语言学将成为领先科学;[iv]世界著名的语音学家方特好像也曾说过,现在急需的不是第五代计算机,而是第五代语言学家。这都是说语言学将处于越来越重要的地位。进入九十年代更有人说,从18世纪以来,世界科学的热点,由经典物理学转向数学,现在又正由数学逐步转向语言学。这当然只是某些科学家的看法,但这种看法也不是一点没有道理的。人的思维离不开语言,语言是思维的物质外壳。所谓智能计算机,也就是能像人一样会思维的计算机,使用这种计算机以实现人机(人与计算机)对话,包括人机笔谈。而要计算机能思维,必须把人的语言规则形式化,输入到计算机中。输入的语言规则如果有错误,或者不全面,不严密,都会严重影响计算机对自然语言的理解,计算机也就不能说出人所能听得懂的语言。而要把语言规则形式化,要保证输入计算机的语言规则全面、准确、严密(这当然也有个过程,不可能一步到位),需要有语言学家的帮助。
在中国,也在酝酿研制智能计算机,并已列入国家科研规划之中。在实施“211工程”中,也拟在多所综合大学内(其中包括我们北京大学)筹建语言实验室,以便利用综合大学文理交叉、师资力量雄厚的优势,来为研制智能计算机作贡献。中国在中文信息处理方面,其实起步还是比较早的。早在五十年代末、六十年代初就开始着手研究机器翻译,在当时还处于世界先进水平。由于众所周知的原因,研究一度处于停滞状态。“文化大革命”后,特别是进入八十年代后,中文信息处理,有比较大的发展,特别是在汉字信息处理方面,而且相应地在全国成立了一些研究机构。但是实际的进展还不让人满意,从语法的角度说,现在只是初步解决了分词和词性标注的问题。句处理还刚刚起步,而其难度将远远超过分词和词性标注。句处理不仅面临着复杂的语音问题、句法规则问题,更面临着复杂的语义问题、知识背景问题。而这些问题的解决都需要有语言学家的参与。过去从事计算机科学研究的学者和从事汉语研究的学者没有或者说基本没有很好的结合。八十年代后期,特别是进入九十年代后,大家越来越意识到这个问题,逐步走上了二者互相结合的道路,双方共同承担科研任务,合作进行研究。我们看到近十年来取得了一些可喜的成绩。
中文信息处理使汉语研究受到前所未有的重视,这是好事,但这对汉语研究者提出了严峻的挑战。就中文信息处理来说,早期的“人机对话”系统采用简单模式匹配方法,这可以看作是一种原始的处理方法。现在广泛使用的有两种方法,一是基于规则的处理方法,这种方法有的以一定的形式文法系统加上“复杂特征”来表述自然语言中大小成分的句法信息和它们之间的组合规则,有的则试图“以概念化、层次化、网络化(简称“HNC”)为基础”来提供概念组合、语义表述的规则(参看黄曾阳(1997));二是基于经验的语料库统计方法,这种方法是以各种统计数据来显示语言成分间的组合可能性。(参看黄昌宁等(1992)和黄昌宁(1993))许多人认为这是两种对立的处理方法。其实在我们看来,无论是哪种处理方法,都离不开自然语言(汉语)的知识。从发展趋势看,基于规则的处理方法和基于经验的语料库统计的处理方法必将走上结合的道路,相辅相成。不管采用哪种处理方法,大家都深感目前有关汉语的知识远远不能满足中文信息处理的需要。单就句法方面的情况说,在中文信息处理过程中将会不断遇到我们所想像不到的问题。许多问题在人看来还是比较容易解决的,但机器解决不了。譬如说,
这两句话中,字面上有相同的部分,那就是“北京的公路建设”,但这两句话的内部构造是不同的。这对我们人来说,只要稍有一点语法知识,是很容易区分的:
但让计算机来切分时,就出了问题,第(2)句它可能会切分为:
近十年来我们参与了一些中文信息处理方面的研究工作。在中文信息处理中,我们就已经遇到了以下四方面的难题:
一是表面词类序列相同而内部结构关系不同的同形格式的区分问题。大家知道,“汉语词类跟句法成分之间不存在简单的一一对应关系”,“不像印欧语那样,一种词类只跟一种句法成分对应”。(参看朱德熙(1985))同一类词在句法结构中可以作不同的句法成分,而在形式上则没有任何不同的标志。例如同是“动词+ 动词”的词类序列,可以表示多种句法关系,请看:
稍有语法知识的人一般都能把它们区别开来,可是计算机则区别不了,你要计算机把它们区别开来,一定得把现代汉语“动词 +动词”在什么条件下形成什么样的结构关系的种种规则充分而准确地输入计算机。说老实话,我们能把它们区分开来,凭的不是严密的规则,而是综合了总体语义理解、自己的经验和部分句法规则。下面再举一个实际的例子:
这两句话,词类序列相同,都是“NP1+被+NP2+VP1+VP2”。对人来说(不管是对汉族人,还是对外国学生),都不难区分,即使有人一下子看不清楚,我们也很容易说明白它们之间的区别:例(19)介词结构“被交通警”一直管到底,不只管VP1“叫去”,还管着VP2“罚了一百块钱”(“被交通警叫去”,“被交通警罚了一百块钱”);而例(20)介词结构“被交通警”只管到VP1“叫去”(“被交通警叫去”),而VP2“写了一个检查”就不受那介词结构管辖了(“※被交通警写了一个检查”)。可是机器分辨不清楚,即使作了上面的说明,也还是分不清楚。机器所要求的是,把“介词结构+VP1+VP2”这一词类序列在什么情况下介词结构只管到VP1,在什么情况下那介词结构可以一直管到VP2的规则,准确而又充分地输入到计算机里去。这样,机器才能识别这类词类序列。(参看詹卫东(1997))
二是句法歧义格式的区分问题。所谓句法歧义格式是指不仅词类序列相同而且具体的词语也相同的歧义句法格式。这种句法歧义,八十年代语法学界已经讨论得很多,归纳起来,大致有以下三种情况:[vi]
1. 由于层次构造不同而造成的句法歧义格式。例如:
2. 由于语法结构关系不同而造成的句法歧义格式。例如:
3. 由于语义结构关系不同而造成的句法歧义格式。例如
(32)山上架着炮。[=“山上正在架炮”,句子表示活动,表动态;“山上”指明
上述三种句法歧义格式,现在有一定汉语语法知识的人都可以运用一定方法把它们所表示的歧义加以分化,可是计算机还不能加以分化。要计算机对这些句法歧义格式加以分化,首先需要人把分化这些句法歧义格式的种种规则充分而又准确地输入计算机。
三是词语串的切分问题,包括一般所说的短语边界问题。所谓词语串是指词和词连在一起所形成的词语序列。由于句法构造有层次性,所以连在一起的词语序列不一定就组成一个合法的句法结构。请看实例:
“爸爸去”这个“名词+动词”的词语串,在例(33)答话里是一个合法的句法结构,可是在例(34)里就不是一个合法的句法结构。我们人很容易区辨,可是计算机区辨不了。你要计算机区辨,那就得把“名词+动词”这样的词语串在句中什么情况下是一个合法的句法结构,在什么情况下不是一个合法的句法结构的规则充分而又准确地输入到计算机里去。(参看马真、陆俭明(1996))
四是句中代词的理解(照应)问题。主要是第三人称代词“他”和反身代词“自己”的理解(照应)问题。句中的“他”跟哪个名词照应,“自己”回指哪个名词,近十多年来,国内外讨论得很多,也总结归纳出了一些照应、回指的规则。但远不能满足中文信息处理的需求。请看下面三个实例:
例(35)里的“他”与“王春贵”照应;例(36)里的“他”与“李春林”照应;例(37)里的“他”则既可以跟“王春贵”照应,也可以跟“李春林”照应。对人来说,这三个句子里的“他”所称代的对象,一般都能分别作出正确的理解;但计算机做不到。要让计算机分别正确理解这三个例句里“他”的称代对象,就得把“他”的照应规则准确而又充分地输入计算机。
在中文信息处理中所碰到的语法问题当然不止这四方面。中文信息处理对汉语语法研究的种种要求,无疑是对汉语语法研究的一个极大的挑战。计算语言学专家俞士汶先生(1997)指出,“句法分析在汉语信息处理系统中具有举足轻重的作用”,“计算机处理需要的汉语语法研究以及句法分析算法研究,在目前来说,应该是汉语信息处理研究的一个重点”。显然,来自中文信息处理的挑战必将大大推进现代汉语语法研究。
二、来自理论方面的挑战
2.1 我们知道,从1998年《马氏文通》诞生到四十年代,汉语语法研究基本上是在传统语法学的间架里进行的。五十年代美国描写语言学的理论与方法逐渐影响汉语语法研究,可以这样说,八十年代中期以前,现代汉语语法研究基本上或者说主要是对汉语语法现象、语法规则的描写说明。乔姆斯基(N. Chomsky)所开创的语言研究基本上是解释性的,八十年代后期陈平先生(1987)的《描写与解释》一文发表后,对现代汉语语法现象、语法规则的解释开始引起汉语语法学界的普遍关注,陆续发表了一些这一方面的论著。对语法现象、语法规则的描写,旨在说明“是什么”,对语法现象、语法规则的解释,旨在说明“为什么”。有人称旨在说明“是什么”的语法研究为“描写性研究”,称旨在说明“为什么”的语法研究为“解释性研究”。(参看邵敬敏(1989))对语法现象、语法规则的“描写性研究”和对语法现象、语法规则的“解释性研究”,这二者事实上是密不可分的。我们同意杨成凯先生(1996)的看法:“描写”与“解释”是个层次问题,它们二者“相辅相成,各有所宜,也各有所用”。不过,我们也不能不承认,从对语法现象、语法规则的“描写性研究”到对语法现象、语法规则的“解释性研究”,应该说是语言研究的一大进步。从语法研究的根本目的来说,我们有理由要求我们的语法研究应尽可能做到:(a)观察的充分、合理性(observational adequacy),(b)描写的充分、合理性(descriptive adequacy),(c)解释的充分、合理性(explanatory adequacy)。语法现象、语法规则的“解释性研究”将会从整体上促进现代汉语语法研究,因为不仅一个合理的解释本身需要经过深入研究后才能得到的,而且解释需以充分、合理的观察和充分、合理的描写为基础,所以对语法现象和语法规则的观察、描写会面临着来自对语法规则解释这一方面的挑战。试以“把”字句为例说明这一点。“把”字句可能是汉语中人们对它研究得最多的一种句式。据有人统计,近50年来,国内外有关“把”字句的论著(包括未发表的学位论文在内)不下500项,八十年代以来国内外有关“把”字句的研究也有300项左右。(参看郑定欧(1998))除了不断加强对“把”字句的观察、描写外,也力图对为什么会构成“把”字句、为什么要使用“把”字句等作出解释――有的(Sun , Chao-fen(孙朝奋)(1995))从探源的角度进行解释,有的(沈阳(1997))则从形式和语义两方面进行解释,也有的(金立鑫(1997))从句法、语义、语境以及个人因素等多方面进行综合解释。这些解释有助于人们对汉语“把”字句的认识,但并不能说已找到了圆满的答案。“把”字句式,是不是汉语所特有的,语法学界有不同看法,这我们暂且不论。(参看郑定欧(1998))如果汉族人在语文表达中用不好“把”字句,外国人学汉语把握不好“把”字句,中文信息处理中解决不好“把”字句的句处理问题,那么不管是人际交际还是人机交际都将受到严重妨害。而要使汉族人用好“把”字句,使外国人掌握好“把”字句,使中文信息处理中处理好“把”字句,就有赖于我们从句法、语义、语用等多方面对“把”字句作进一步的合理观察,合理描写,合理解释,搞清楚(1)什么情况下必须用“把”字句,条件是什么;(2)什么情况下决不能用“把”字句,原因是什么;(3)什么情况下可用可不用“把”字句;(4)在可用可不用“把”字句的情况下,用与不用在意义表达上有什么差异;(5)“把”字句到底跟哪些句式关系最密切。再如,乔姆斯基在扩展的标准理论(1972-1978)里提出了“移位-WH”(Move-WH)转换规则,在后来的支配和约束理论(G B Theory )里进一步完善为“移位-α”(Move-α)转换规则,从而较好地解释了为什么同一个D-结构(Deep structure)会形成不同的S-结构(Surface structure)。-α是代表某个范畴,“移位-α”就语法说主要是指谓词V的某个论元(argument)NP的移位。汉语里存在着大量的名词移位的现象,要用乔姆斯基的“移位-α”(Move-α)转换规则来解释汉语里的名词移位现象,这就要求我们必须对汉语里的种种名词移位现象进行充分的考察、合理的描写,而这无疑会推动汉语移位现象的深入研究。已有的研究成果表明,汉语里不仅存在着整体名词性成分移位现象,还存在着名词短语部分成分移位现象,例如:“他剥去了橘子皮Ù他把橘子剥去了皮”。(参看沈阳(1996,1997))这对乔姆斯基的“移位-α”(Move-α)转换规则无疑会起到进一步补充、完善的作用。再如,近十年来大家对同类词连用的规则、某些句法成分排序的规则比较关注,发表了一些很好的研究成果,[vii]但大多还只是描写。如果我们能对那种种排序规则作出较为合理的解释,必将有助于人们对种种排序规则的理解,而且还可能进一步挖掘和发现有价值的排序现象。
2.2 最早开展对汉语句子的认知研究是心理学界,而不是语言学界。国际认知心理学界对于句子的理解问题,从六七十年代开始就注意研究了。研究者普遍承认,对句子的理解是一个多层面的复杂运作过程。但是,大家对于人在加工或理解句子中句法分析和语义分析的作用和关系,一直存在着不同的看法。据江新先生(1996,1997)介绍,在国际认知心理学界存在着以下两种对立的理论观点:一种称为“模块化(modularity)理论”,一种称为“竞争模式(competition model)理论”。前者认为,某个句子的加工或理解,句法分析是一个独立于而且先于语义等其他过程的自主过程,句法加工构成一个模块,这个模块只受结构信息(句法信息)的影响,而不受非句法信息的影响,语义或语用信息只对句子的最终解释产生影响。因此“模块化理论”也称“句法自主理论”。而后者认为,各个层面的加工过程是相互作用的,句子的理解是多种加工线索(句法线索、语义线索、形态线索、语境线索等)进行互相竞争和聚合的过程,在句子加工或理解过程中,各种线索在不同点随时出现相互竞争和聚合,句子的最终解释,取决于这些线索的相对强度,当这些线索最后聚合,便完成句子的加工或理解。显然,竞争模式是一个交互作用模型。
中国心理学界缪小春先生等从八十年代初就以汉语为实例开始对句子理解中的句法策略和语义策略进行研究。他们采用的都是对成年人(包括失语症者)进行测试的办法。其结果,有的测试支持模块化理论,有的测试支持竞争模式理论。所以,汉人理解汉语句子时,究竟什么线索最重要,句法分析是否独立于其他线索,句法信息、语义信息、语用信息等如何相互影响、相互作用,中国心理学界并未取得一致的意见。(分别参看缪小春(1982),缪小春、陈国鹏、应厚昌(1984),彭聃龄、刘松林(1993),陈烜之、熊蔚华(1995),江新(1996))
语言学界开始注意对汉语语法的认知研究,那是八十年代中期的事。最早进行这方面成功尝试的是美籍华人学者戴浩一(Tai,James H.Y.)先生(1985)。进入九十年代以后,进行这方面研究的人越来越多。中国学者如廖秋忠、沈家煊、张敏、袁毓林、石毓智、张谊生、刘宁生、张伯江、方梅等;美籍华人学者除戴浩一外,还有谢信一;日本学者如中川正之、古川裕等。汉语语法的认知研究,其目的是试图从人的认知角度对种种语法现象作出合理的解释,而且要求自己所作的解释在语法形式上能找到系统的而不是孤立的证据。从事认知语法研究的学者们,已从“临摹性(iconicity)”、“典型范畴(prototypical
认知语法学的作用当然主要在解释,但也不限于解释,它也能挖掘出一些用以往的研究理论和方法所不易发现的语法现象。譬如说,“我儿子”和“我的儿子”这两种说法都成立,但是,“这是我儿子”,通常不会说成“这是我的儿子”(只有在强调或对比的情况下才会说“这是我的儿子”);而“我的儿子'都来了”(自然重音在“都”上。假如说话人有好几个儿子的话),则不会说成“我儿子'都来了”。即:
再譬如:
这些现象正是张敏(1998)从认知的角度解释偏正结构中“的”的隐现问题时才挖掘出来的。毋庸置疑,认知语法学的兴起为汉语解释性语法研究开辟了一条新路子,同时也将有助于汉语描写性语法研究的进一步深入。













