孙宏开:世界上究竟有多少种语言

全球语言知多少?——有关语言识别和语言与方言界限的讨论

孙宏开研究员

(作者简介:孙宏开,语言资源高精尖创新中心'语言识别理论及语言数量统计的方法论研究'项目负责人,语言资源高精尖创新中心特聘研究员,中国社会科学院荣誉学部委员。)

世界上究竟有多少种语言?这是一个非常重要的问题,人们目前通常使用的世界上有6000多种语言的数字是从哪里来的呢?根据我个人的了解,主要是根据书名为《世界的语言》(Ethnologue: Languages of the World)这本书的数据。主编这部书的机构是在美国得克萨斯州达拉斯的世界少数民族语文研究院,简称SIL(暑期语言学院)。这本书从1951年开始编辑第一卷,每若干年修订一次,至今已经修订了18次。到2016年出版19编。这一卷公布世界语言的数字是 7097种。其中包括非洲:2139种,美洲: 1062 种;亚洲:2296种;欧洲:287 种;大洋洲: 1313种。

那么这个数字是如何整理出来的呢?以中国为例,第19版公布中国的语言数字是301种,与我们国家公布的130多种多出了一倍还多。例如,这部书将大陆汉语分出15种,香港汉语分出4种,澳门和台湾汉语各分出3种,彝语分出40多种,苗语分出30多种,壮语分出17种……。事情还不仅仅如此。

2009年,美国《科学》杂志刊登了一篇文章,讨论了中国的语言的识别问题。文章报道了一位学者,在中国做语言调查。在我国云南省彝族地区的一个很小的地方,用语言互通度的方法,一下子识别出24种语言来。而且这24种'语言'也一一被这部书收进去了。这就引起中国学者的怀疑。因为中国民族语文工作者在20世纪50年代曾经对这一地区的彝语开展过深入调查研究,已经把中国的彝语划为6大方言、26个土语,而这位学者识别出来的24种'语言'全部都在彝语东南部方言26个土语之一的文西土语分布地区之内,属于文西土语8个支系中的'普拉'支系。

根据上述中国的情况来看,我们就发现《世界的语言》这部书所列出的语言数字值得进一步分析和讨论。追根溯源,我们再仔细研究这部书对全球语言数量的统计也存在一些问题。例如:

1.《世界的语言》有关语言数字的统计是根据每个国家和地区的语言数量总数加起来的。以亚洲为例,印度尼西亚 709 种,印度 453 种,中国 301 种,菲律宾 192 种,马来西亚 145 种,尼泊尔124 种,缅甸 117 种,越南 110 种。以上所列 8 个在百种以上语言的国家里,有许多重复计算的语言。例如汉语在中国是主体语言,在其他国家和地区所讲的汉语也会统计在该国家或地区的语言数字之内。再如藏语在中国有,在尼泊尔、不丹、印度等许多国家都有,都会重复统计。英语有 106 个国家使用,西班牙语有 31 个国家使用,阿拉伯语有 58 个国家使用,汉语有 35 个国家和地区使用,俄语有 17 个国家使用,法语有 53 个国家使用,德语有 26个国家使用……

2.将大量方言、土语的数字统计在内。这方面重复统计的数量更大。例如前面提到中国的语言数字,就是将中国的汉语和少数民族语言的方言、土语的名称重复统计在单一语言数量之内。

3.该书还将 100 多种手语(Sign language)也计算在全球语言数量之内。

我们前面提到的世界少数民族语文研究院所编的《世界的语言》,是目前国际上最权威的全球语言数字。联合国教科文组织、国际语言代码专家组给每一种语言确定的语言代码也是依据这个组织所提供的信息。那么如果这个数字有那么多值得进一步推敲的问题,我们还能够相信这个数字的科学性吗?

值得推敲的还有另外一个问题,就是语言的识别方法。大家知道,自20世纪30年代开始,美国暑期语言学院就在全球开展语言调查研究,他们确定某种语言是不是一种独立的语言,根据他们的报道是采用的语言互通度(mutual intelligibility)的方法。例如,《科学》杂志报道的中国彝族地区识别出的24种语言,其过程是这样的:佩尔基(Jamin Perkey)在云南的村寨中一次会待上3至5天,调查10名左右当地人。他使用一个包括1200词的词表,用汉语西南官话说出一个词,并且出示这种物品的图片,然后录下人们用自己语言说出的这个词。在调查间歇,他录下人们所讲的故事,播放给另外一个村寨的人听,以便确定互通度。凡是沟通有困难的就算独立的语言。

说实在的,这种方法与中国识别语言的方法存在很大差异。差不多与美国暑期语言学院成立同时,中国的专家学者也在国内开展少数民族语言调查研究。尤其是中华人民共和国成立以后,对中国境内的语言和方言开展了大规模的实地调查。仅1956年至1958年,中国政府就组织了700多人的队伍,对中国境内的少数民族语言开展全面普查,积累了一整套确定语言和方言界限的理论和方法。这就是语言社会身份差异度和语言结构差异度相结合的识别方法。

所谓语言社会身份差异度,是指使用这种语言的族群,有没有单独的自称?这种自称的含义是什么?造成语言差别的历史原因是什么?在实践中,几乎所有确定为独立语言的人们群体,他们在许多方面都能够解释各种不同的原因,有的是历史造成的,有的是社会造成的,有的是地理分布造成的……。此外还要调查这种语言的外缘是否清楚,调查使用这种语言的群体的历史传说和文化传统,本民族对周围其他民族语言的语感,一般有认同感的为方言,无认同感的为语言。

所谓语言结构差异度,通常会比较两种语言之间的语音、词汇和语法的差异。尤其是词汇的差异度,是最容易量化的。我们总结出来的初步经验是:选2000个左右最基本的常用词作比较内容,两个比较对象之间的同源词不足50%,很可能他们都是独立的语言。而同源词在50%以上,则是同一语言的不同方言;同源词在80%以上,是同一方言内部的不同土语。这是从成千上万次词汇比较中总结出来的一个重要的数据。如果有时候词汇比较仍然有疑虑,不能够下结论,则进一步比较语音和语法方面的差异。

这两种方法比较起来,用互通度识别语言的方法比较简单,容易量化,操作简便,但有一定的随意性;用社会身份差异度和语言结构差异度相结合的方法比较复杂,操作难度大,不大容易被语言学界所接受。

求得世界语言确切数据的工作看起来容易,但是要通过做好这件事情解决背后隐藏的问题是很难的。因此,要解决好这个问题我有以下几点思考:

第一,要承认这个问题的复杂性。世界少数民族语文研究院在这一方面已经做了大量的工作,积累了丰富的经验,要与他们进一步沟通,共同研究解决这一问题的途径和方法,寻求一个真实的世界语言数据。在方法论上,要讨论一个彼此都能够接受的又比较简便的易于操作的语言测试方法。

第二,要做大量的调查研究,确切掌握各个国家的语情以及该国的族群政策和语言政策。尤其要了解每个国家内部语言的差异情况,包括使用情况和结构差异情况,还要了解各国政府对这种差异的态度。

第三,要通过这项任务的落实,陆续收集并积累全球语言的资料,包括语言结构方面的资料,语法、词典等。还要收集语情动态,掌握国际第一手信息资料,建立云数据库。要建立网站,利用网络平台发布研究成果,利用网络加强与国际相关机构的联系与沟通。

第四,要与国际语言学界合作。尤其要与联合国教科文组织、国际标准化组织发布语言代码的机构沟通。这是一场在软实力方面争夺话语权的斗争,也是中国语言学走向国际、走向世界的主要领域之一。我们的目的与 SIL 的目的不同。他们的目的是传播宗教,我们的目的是建立一个全球命运共同体。

第五,语言是沟通人们心灵的桥梁。要与国家'一带一路'的战略目标结合起来,一步一个脚印,踏踏实实地向前推进。

第六,要培养一支专业素质好,精干、有事业心、能打硬仗的队伍。这支队伍既要有长远目标,又能够脚踏实地从现在一件一件小事做起。在这一点上,我寄希望于北京语言大学。

本文转载自公众号:汉语堂

(0)

相关推荐