语言学与现代科学
语言学,无论就其理论告构而言,还是就其任务之确切性而言,都是在人文科学中最先进而且对其他各种学科有重大作用的带头学科、
——皮亚杰(Jean .Piaget)
1.现代语言学的重要地位
今天,语言学愈来愈受到现代科学界的重视。
它的重大作用,已经超越其自身原有的边界。
电子计算松构成了现代科学技术的一大支柱。然而,计算机软件的核心称为“算法语言”,计算机科学的主要理论基础称为“形式语言学”。直接来自语言学的一系列术语,如“语法、语义、句子、词……”,活跃在程序设计和人机对话的整个过程
之中。四种“形式文法”对应着四种“自动机”——这是自动机理论的一条基本原理。可以毫不夸
张地说:没有现代语言学,电子计算机就无法得到充分的发展和广泛的应用。
本世纪以来,人们从物理学、生理学、心理学、数学、统计学、社会学、人类学、教育学、历史学、地理学……各个角度去探讨语言现象。物理语言学(语言声学)、生理语言学、心理语言学、数理语言学、统计语言学、计算语言学、社会语言学、人类语言学、教育语言学、历史语言学、地理语言学(方言地理学)、实验语言学……这一连串边缘性学科,都列入了现代语言学的新分支名单之中。转换生成语法、格语法、功能语法、符号语义、逻辑语义、模糊语义……一买列崭新的概念,源源不断地产生出来。“人工智能”的主要内容之一,是“自然语言的理解”,而“图象识别”的“语言学方法”,占有突出的地位。语宫学领域已成为现代科学中最有活力的生长点之一。
本世纪下半叶出现的“横向科学”——系统论、控制论、信息论,都把语言问题当作极重要的处理对象。现代哲学界认为:“结构语言学为建立思维的模型、发展认识论奠定了基础。”语言学无疑也是
探求思维秘密的一把钥匙。
现代科学中的“语言”概念,比过去大大扩充了。什么是“语言”呢?语言是人类社会特有的一种信息系统,是人们用来进行交际和思维活动的有效工具。有声语言(口语)及其文字记录(书面语),不过是广义语言中的特殊形式,即“自然语言”的形式。随着现代科学和计算机技术发展的需要,各式各样的“人工语言”被设计出来了。这些人工语言也同样具有词汇形式、语法规则、语句结构和语义内容等等。语言学课题已经成了现代科学的基本课题之一。
总之,语言学是一门又古老又年轻的大学科。说它古老,是因为从两千多年以前人们就开始研究语言;说它年轻,是因为现代语言科学还只有一百多年的历史。
2.传统语文学的特点
语言是人类区别于动物的最主要特征之-一。因此,有关语言的知识,比天文、数学开始得更早。语言研究的历史可以追溯到上古时期。但是,世界
学者公认:语言学(linguistics)成为一门现代意义下的语言科学(science of.languages)只是从19世纪才开始的。在这以前的两千多年间,研究语言的学问被称为“语文学”(philology)。
如此源远流长的传统语文学,在古代中国、印度和希腊罗马都形成了各自的特色。在漫长的历史时期内,人们学习和传授的都是这种“语文学”。即使在今天,它依然占有一定的学术地位。
世界上现已查明有5,651种不同的语言或方言①,其中有许多种还没有被公认为独立的语言。此外有不少古代语言已经死亡,只留下了历史文献即书面语材料(如古埃及语、古巴比伦语、古梵语、古希腊语、古拉丁语等等)。数以于计的语言使用人口愈来愈少,目前正在衰亡之中(如170种北美印第安语言、250种澳洲土语、280种西非土语等等)。语言学家一般确认的独立的语言为2,790种,其中有70%还没有相应的通用文字。经过分析研究的语言只有500种左右。目前使用人口超过五千万的“大语种”
共13种,即:汉语、英语、俄语、法语、西班牙语、阿拉伯语、印度斯坦语、日本语、印尼语、德语、孟加拉语、葡萄牙语、意大利语。使用人口在一百万以上的语言共177种(详见本章第10节)。
可见,世界上自然语言的种类,比动植物的种类少得多,然而,其结构复杂程度却高得多。这些语言之间有什么相互联系?它们各自是怎样形成的?如何将它们进行分类?
远古时代,不同的人类共同体就产生了各自的原始语言。后来,语言随着社会的瓦解而分化,又随着社会的统一而融合。在氏族不断迁移和分散的情况下,语言分化过程占优势;阶级和国家出现后,分化过程和融合过程交叉进行。这样就形成了现在的多种语言。
在社会大动荡大分化时,一种语言的不同方言会随之分化为独立的语言,而新的国家政治力量又把这种分化结果固定下来。例如,在罗马帝国解体后,古拉丁语衰亡了,而从6世纪到9世纪,在民间拉丁语的基础上,逐步形成了意大利语、法语、西班牙语、葡萄牙语、罗马尼亚语等等罗曼系语言。这些由一种共同语分化出来的语言,就是亲属语言。
语言的统一过程,除了不同方言集中为民族共同语之外,还有异族语言的交融。例如在11世纪,不列颠岛被法国的诺曼族征服,很长时期内英国贵族讲法语。在整个中古英语时期,英语和法语都在交融。结果是英语取得胜利。1362年,英王第一次用英语召开国会,并规定英语为英国统一的语言。但是现代英语中留下很多法语的借词,这就是交融的痕迹。又如,在15到16世纪,西班牙和葡萄牙征服了中南美洲,强迫同化了土著的印第安人,西班牙语(在拉丁美洲西部)和葡萄牙语(在巴西)成为这些国家的主要语言。至于美国、加拿大,澳大利亚,新西兰及前英殖民地使用英语,则是大量移民的结果。
现代汉语普通话的形成,也是语言交融和统一的过程。汉族在历史上曾多次受少数民族的统治、近一千年来。北京先后成为辽、金、元、明、清五个朝代的首都,其中有四个朝代是由少数民族(契丹、女真、蒙古、满)统治的。但是由于汉族人口众多,有高度发展的文化,在语言交融过程中汉语终于成为胜利者。而且,由于政权长期统一的作用,吴语、闽语、粤语等等方言都没有分化为独立的语言。
以上是人们在历史记载中知道的情况。但在远古没有文字记载的时期,各语言是怎样发展和相互作用的呢?这就要通过历史语言学的比较方法才能推测了。
历史比较语言学详尽地占有了材料,对于从北欧到东印度的大量历史文献,以及许多种现代语言纪录,作了全面对比。它初步抓住了语言系统中最稳定、最本质的组成部分,以基本词汇、语音形式和语法构造(主要是形态特征)作为考察的重点,从典型代表性的有限语言事实出发,由个别到一般进行归纳总结,探索了语言演变的历史规律。它对印欧语系、亚非语系(又称闪含语系)、阿尔泰-乌拉尔等语系的研究,取得了惊人的成就。
7.历史比较语言学的局限性
一百多年来语言研究的实践证明,历史比较语言学的理论和方法都有很高的价值;但它也暴露了种种局限性。
首先,历史比较语言学的前提,是必须存在亲属语言的关系。可是,现在世界上有些语言,一直找不出亲属关系。比如,亚洲的日本语、朝鲜语,欧洲的阿尔巴尼亚语、巴斯克语,以及非洲、美洲、澳洲的许多土著语言,都是如此。
从现有的语言材料看来,很难说人类语言在远古时期只有少数的几个“共同”来源。很可能,在人类史前的蒙昧阶段,各原始人群都有不同的原始语言,种类数量一开始就是非常多的。现在我们当然无法追踪史前(有文字记载以前)任何一种语言所经历的实际发展阶段。但是在19世纪,经过摩尔根对于文明史前社会的活标本——印第安部落等的研究,人们可以约略知道处于文明史前各种不同社会发展阶段的原始语言的大概情况。摩尔根在他的
巨著《古代社会》中,提供了下述原始语言的材料:
“蒙昧阶段”。早期——未发现语言材料;中期——澳大利亚土著卡米拉罗依人的语言,及大多数波利尼亚人的语言;晚期——某些无园艺印第安人,如阿撒巴拉卡人的语言。
“野蛮阶段”。早期——某些半村居印第安人,如易洛魁人、乔克塔人和切罗基人的语言;中期——某些村居印第安人,如苏尼人、阿兹特克人、乔卢兰人的语言;晚期——澳大利亚的塔斯马尼亚人的语言(大约已进入了旧石器时代)。
语言学家和历史学家推测:原始语言的句法范
畴和词汇数量,同原始人群的生活和劳动条件有密切关系。原始动词可能产生于蒙昧阶段早期。在现已知道的这样的史前阶段,世界上人类散布的地区是非常广阔的,而同一地区的各人群之间的交往并不太频繁。由此看来,并没有把握可以认定所有的语言都可以归入少数几个谱系之中。
其次,对于已经归入同一语系的亲属语言,目前所能获得的实际材料,往往是很不充分的。就拿研究得最成功的印欧语系诸语言来说,焚语、希腊语都有公元前10~7世纪左右的文字材料;但是古斯拉夫语直到公元9世纪才有书面记录;拉脱维亚语直到15世纪、立陶宛语直到16世纪才有书面记录;
……然而这些语言所保存的远古特点,却是不能以年代先后来判断的。从事历史比较的语言学家,往往忽视了这些因素,所以作出的结论难免发生错误。
再拿汉藏语系来说,情况更为棘手。汉语尽管从公元前14世纪就有文字记载,但是方块字并不是拼音文字;藏语和缅甸语迟至公元7世纪、古泰语(遥罗语)迟至13世纪才有书面记录;其他许多语言长期以来一直没有自己的文字。汉藏语系诸语言相互分隔了很久,散布的地区又很广,现存的共同特点是不多的。既然在词源关系上难以找到足够的、确凿可靠的证据,那么,把它们放在一起加以比较,就往往显得没有多大说服力。
采用历史比较法,在语言学上获得的成就,远远比不上在生物学上获得的成就。尤其是对于远古的“原始语”的“重建”工作,例如对原始印欧语的构拟,无法得到强有力的证实,因而至今也不能作出公认的结论。许多自然语言的古代特点,在还没有文字记录以前就已经失去了;我们仅依据现有的材料,实际上不可能把它们的“原始共同语”重建出来。许多历史语言学家对此众说纷纭、莫衷一是。例如施菜赫尔构拟出所调“印欧原始语”或“亚利安母语”(Aryan Ursprach),其后布鲁格
曼(Karl Brugmann 1849-1919)也构拟“古印欧母语”,两人的创作差别太悬殊。时人嘲笑说,他们构拟“母语”前后相隔仅20年,但所谓“亚利安母语”已变得无从辨认了。
还有人提出所谓“远缘亲属关系”,假设从非洲经过北欧、西伯利亚、蒙古、中国东北直到北美阿拉斯加,再加上美洲印第安语和日本语、朝鲜语、总称为Nostratic超级语系(Superfamily)。
但是,现代有些语言学家对此不以为然。英国斯威特(H.Swcet)就指出:“语言的历史比较研
充,容易使人对每一语言的重要个性视而不见。”他们批评说,过分强调历史上的“共性”,导致语言学中的牵强附会、舍近求远的倾向。为了补救历史比较法的严重缺陷,人们开展了语言的“类型对比”研究。
8.语言的类型对比和“生长相关律”语言形态类型学(morphological typology)是在历史比较语言学后期产生的。它从语言的形态分类发展而来,但是不着重历史的谱系比较,而是著重于同时的各语言的形态对比。
在历史比较语言学看来,不属于同一谱系的各语言不能加以比较;但在语言形态类型学看来,任何语言分别进行系统性的分解后,都可加以比较。对比的范围包括语音结构、音位系统、形态特征、句法特征、修辞手段等等。方法是分析个性,归纳共性。
本世纪以来,美国语言学家萨不尔(Edward
Sapir 1884-1939)等人把世界语言按形态分为六
大类,到芬克(F。N.Finck)扩充为八大类,它们是:
(1)词根分析型语言——如汉语;
(2)多元综合型语言—一如爱斯基摩语;
(3)序列组合型语言——一如苏比亚语;
(4)从属附着型语言—一如突厥语;
(5)词干孤立型语言——如萨满语;
(6)词根屈折型语言—一如阿拉伯语;
(7)词干屈折型语言——如现代希腊语;
(8)词组屈折型语言——如格鲁吉亚语。
这样的形态分类是否妥当,还必须再进行广泛深入的调查研究。
语言类型对比,突破了历史谱系的老框框,向前又跨了一大步。当语言学的比较方法不是孤立地针对历史语音和语法现象,而是面对一般语言的普遍系统的性质时,它就上升为类型学的研究。马克思曾指出:“最发达语言的某些规律和特性,也是最不发达语言所有的。”
发现语言现象中含有的“类型规律”,也是从生物学中得到启发的。恩格斯在《自然辩证法》中曾引证达尔文所提出的“生长相关律”表明:凡有偶蹄的哺乳动物,通常必有反的复杂的胃囊;凡有无细胞核的红血球,并以两个骨节联结后脑骨和第一节脊椎骨的动物,无例外地都有乳腺哺养幼子。①生物学中的这些现象具有相互制约关系,不是偶然出现的。类似地,语言学中也有这样的“类型规律”。例如,美国语言学家雅可布孙(Roman
Jakobson 1896-)指出了如下普遍现象:如果一个语言中有塞音和塞擦音的对立系统,就必然有擦音,比方现代汉语和英语中有塞音〔t〕和塞擦音[ts],同时也就有擦音[s];如果一个语言中有圆唇化的前元音,就必然有圆唇化的后元音,比方现代汉语和法语中有前元音[y],同时也就有相应的后元音[u〕。类型对比的方法还可以帮助历史语言学检验“原始共同语”的构拟能不能成立,是否符合语言结构的一般原则。例如,雅可布孙指
出:从前的历史语言学家曾经把原始印欧语的舌尖塞音系统构拟为t,d,dh(h代表送气);但是类型对比表明这样一个规律:任何语言,凡有t,d,dh者,必定还有th存在,从而弥补了上述构拟的不足之处。②
语言的类型对比,还可以从生物进化规律方面得到更多的启发。生物学研究表明:相同的生活环境,可以使不同种类的生物,具有类似的器官。例如哺乳类的鲸和海豚都生活在海洋之中,它们就跟海洋里的其他鱼类相似,有流线型的身体和象鱼鳍那样的运动器官。在语言学方面,我们看到很有趣
的类似现象:各种具有少量音位组合和大悬单音节词的分析型语言(又称孤立语),如汉语、越南语、美洲印第安语和非洲班图语,尽管不属于同一谱系,但却都具有声调。
9.语言的聚合发展与波动理论
传统的印欧语历史比较语言学家认为,所有的印欧系语言都是从一个原始的印欧语中分化出来的。这种理论以施菜赫尔为代表,叫做语言的分化发展理论。俄国著名语言学家特鲁别科(N.S.Trub-etzkoy,1890-1938)不同意这种观点,1937年他提出了与此相反的“语言聚合发展”的模式,以及“聚合-分化相结合”的模式。
他认为,“语系”的概念,并不要求由同一原始语分化出许多“子孙”语言作为前提。“语系”是指一群语言,它们除了语言结构上有一系列共同点以外,还有一系列“语言材料上的一致”;也就是说,它们中间有相当数量的语法成分和词汇成分表现出有规律的语音对应关系。但是,为了解释语音对应规律,不必借助“共同原始语”这一假设。因为这种规律也存在于某种语言从另一种非亲属语言大量借用的现象之中。例如,日本语、朝鲜语、越南语都从古代汉语借用了大量的词汇,但是并不能确定这四种语言相互间的“亲属关系”。
特鲁别科指出:“没有充分的根据能使人假设有一个单一的原始印欧语,似乎所有的印欧语言都是从这种原始印欧语发展出来的。我们有同样的理由,可以设想一种相反的发展图景:即假设印欧语各语族的祖先最初彼此并不相同,仅仅随着时间的推移,由于经常接触、相互影响和借用,彼此才相近,但并未达到完全一致。语言历史中既有分化发展,也有聚合发展。……语系可能是分化发展的产物,或者是聚合发展的产物,也可能是两种类型的发展按不同比例相结合的产物。”①
其实,在特鲁别科以前,德国历史比较语言学家施密特(J.Schmidt 1843-1901)就提出了印欧语系扩散的“波动理论”(wellentheorie)。这是从物理学中借用来的一种相互作用传递的模式,它可以解释语言形式怎样从某一方言发展而来,然后扩散到周围各语言的大片地区。这就象在水面上由一块石子激起的波动,逐渐地向四处传递它的影响。施密特企图用物理模式代替生物学模式。波动理论对于施莱赫尔的“语言谱系树理论”是一个很大的挑战。施密特认为,原始印欧语是由许多方言组成的,其中新的语言因素从中心向四周作波动式的扩散。印欧诸语言是由一系列共同的特征相互联结在一起的,这些语言之间并没有明确的分界。施密特的著作对于印欧语地理方言学的影响很大。
“波动理论”不仅适用于一种语言的诸方言和亲属语系的诸语群,并且适用于在地理分布上彼此邻近的非亲属语言。它们因为相互影响的结果,在语音和语法结构上获得一系列的共同特征。共同性的多少,取决于这些语言在地理上接壤时间的长短和相互影响的程度。例如,乌拉尔语系(芬兰语、匈牙利语等)就有一系列的结构特征跟阿尔泰语系(即突厥诸语言、蒙古诸语言和满州-通古斯诸语言)是共同的。阿尔泰诸语言本身也有某些结构特征跟朝鲜语、日本语相似。此外,日本语还具有其他一些同马来-玻里尼西语系接近的特点。在亚洲与非洲接壤的古代文明摇篮地区,即从西亚两河流域到北非,由于埃及语(科卜特语)、希伯来语、阿拉伯语、柏柏尔语、库什特语、豪萨语等等在语言结构上有那么多的共同点,所以通常把它们都归并为“亚非语系”(又称为闪含语系)。
图2·9·1施密特的波动理论(1872年)示意图日本语言学家桥本万太郎(Mantairo Hashi-moto1932-)在《语言类型地理学》一书中,批评了以施莱赫尔为代表的“谐系树理论”和施密特开创的“波动理论”,认为他们都只抓住了语言发
展的一个侧面,而忽视了另一面。必须把那些相互矛盾的两个侧面统一地加以阐述,才更接近语言的历史和现实。
10.世界主要语言的谱系
本节介绍世界上现有的主要语言(使用人口在一百万以上的共177种),以及历史上有文字记录的古代语言。按照国际上较通行的语系、语族分类排列。
(1)汉藏语系(原称为印度-中国语系)
4个语族,总人口104,254万。
A.汉语族94,000万人。汉语,包括北方话,华北方言、东北方言、西北方言、西南方言、下江方言;吴方言,闽方言,粤方言,湘方言,赣方言和客家方言。
B.泰-壮语族5,792万人。泰语(3,900万人),壮语(1,209万人),老挝语(250万人),布依语
(172万人),掸语(150万人),侗语(111万人)。
C.藏-缅语族 3,885万人。缅甸语(2,500万人),弊语(485万人),藏语(445万人),克伦语(250万人),白语(105万人),宗卡语(100万人)。
D.苗-理语族577万人。苗语(430万人),瑶语(147万人)。
古代汉藏语:古汉语从公元前14世纪起有文献;古代藏语和缅甸语从公元7世纪起有文献和碑铭;古代西夏国的彝语在11世纪有了西夏文;古泰语在13世纪有了遥罗文。
(2)印欧语系(印度-欧歹巴语系)9个语族,总人口204,692万。
A,印度语族58,625万人。印地语(18,000万
人),孟加拉语(12,500万人),旁遮普语(6,000万人),马拉蒂语(4,800万人),比哈尔语(4,100万人),古吉拉特语(2,700万人),乌尔都语(2,600万人),奥里亚语(2,000万人),
拉贾斯坦语(1,500万人),僧伽罗语(1,000万人),阿萨姆语(900万人),尼泊尔语(700万人),信德语(650万人),吉卜赛语(500万人),克什米尔语(300万人),巴利语(240万人),康卡尼语
(135万人)。
古印度梵文从公元前1,500年有文献。公元前
6世纪佛教徒已使用巴利文。近代印地语从公元12世纪起有文献。
B.伊朗语族5,330万人。波斯语(2,500)万人),普什图语(1,600万人),塔吉克语(600万人),库尔德语(480万人),俾路支语(150万人)。
古波斯语用楔形文字,从公元前5世纪起有文献。吐火罗语从1世纪起有文献(在新疆发现)。
安息语、粟特语、萨基安语,都是中古波斯语的方言。近代波斯语从9世纪起有文献。
C.日耳曼语族48,832万人。英语(35,000万
人),德语(10,000万人),荷兰语(1,4000万人),瑞典语(900万人),佛拉芒语(550万人),依地绪语(又名犹太德语,500万人),丹麦语(500万人),挪威语(460万人),阿非利堪语(南非荷兰语,400万人)冰岛语(22万人)。
古日耳曼语——哥特语从4世纪、古英语从8世纪、高地德语从8世纪、古冰岛语和挪威语从12世纪、瑞典语和丹麦语从13世纪、荷兰语和佛里西亚语从14世纪,陆续开始有文献记录。
D.罗曼语族51,720万人。西班牙语(21,000
万人),葡萄牙语(11,500万人),法语(9,000万人),意大利语(6,500万人),罗马尼亚语(1,800万人),普罗旺斯语(900万人),加泰罗尼亚语(600万人),摩尔达维亚语(270万人),撒了语(100万人),拉托罗曼语(50万人。)
古拉丁语从公元前3世纪有文献。它后来成为西罗马帝国的共同语。8世纪以后,由民间拉丁语分化形成了各罗曼语言。
E.凯尔特语族340万人。爱尔兰语(140万人),威尔士语(100万人),布列塔尼语(100万人)。
古代高卢语、不列颠语都属于这一语族。爱尔兰语从7世纪、威尔士语从11世纪、布列塔尼语从14世纪起有文献。
F.希腊语族1,000万人。分布在希腊、塞浦路斯和阿尔巴尼亚。
古希腊语有几种方言。公元前9世纪的荷马史诗用意翁尼亚和爱奥利方言混合记录。
G.斯拉夫语族37,575万人。俄语(24,000万人),乌克兰语(4,500万人),波兰语(4,000万人),塞尔维亚语(1,600万人),捷克语(1,000万人),白俄罗斯语(900万人),保加利亚语(800万人),斯洛伐克语(500万人),斯洛文尼
亚语(150万人),马其顿语(125万人)。
古斯拉夫语的马其顿方言从9世纪、波希米亚语从9世纪、塞尔维亚语和波兰语从14世纪,陆续开始有文献记载,
H.波罗的语族520万人。立陶宛语(320万人),拉脱维亚语(200万人)。
古普鲁士语在17世纪死亡。波罗的语族比印欧语系的其他语言保存着更多的古代特点。
J.阿美尼亚语族400万人。分东、西两个语
支。
古阿美尼亚语从5世纪起有文献。
此外,有的语言学家认为阿尔巴尼亚语(350万人)也属于印欧语系。
(3)亚非语系(又称为闪一含语系)3个语族,总人口19,080万人。
A.闪米特语族14,200万人。阿拉伯语(12,700万人),阿姆哈拉语(900万人),希伯来语(320万人),剔里尼亚语(250万人)马尔他语
(30万人)。
古闪族的巴比伦语从公元前3,800~2,700年就有了书面文献,用楔形文字;公元前7至4世纪使用新巴比伦语,后来被亚拉姆语代替。古希伯来语从公元前13世纪、腓尼基语从公元前9世纪起有文献记录。亚拉姆语从公元前8世纪到公元13世纪有文献记录。古阿拉伯语从公元前2世纪起有文献,7世纪伊斯兰教兴起后,中部阿拉伯语写成的《可兰经》传到亚、非、欧三大洲,对于推广阿拉伯语起了决定性的作用。
B.含-柏柏语族2,380万人。柏柏尔语(600万人,包括阿尔及利亚的卡布列方言和摩洛哥的什卢赫方言),盖拉语(800万人,在埃塞俄比亚),索马里语(480万人),西达莫语(400万人),贝贾语(100万人)。
古含语——埃及语从公元前4000年就有了最古的文献,用圣书体象形文字(hieroglyph)写成。公元前2200年发展为僧侣体(hieratic),公元前4世纪发展为平民体(demotic)。到公元3世纪,埃及在罗马帝国统治下改奉基督教,用科卜特文(coptic)。公元7世纪,埃及人改用阿拉伯语。
至于柏柏语,有公元前3世纪的碑铭,但很少有文献记录。库什特语直到19世纪还没有文字。
C.乍得语族2,500万人。主要是豪萨语,分布在尼日利亚和中非。
古代努比亚语有4~7世纪的文献,用科卜特文翻译圣经。近代努比亚语和豪萨语采用阿拉伯字母。
(4)阿尔泰语系
3个语族,总人口8,790万。
A.突厥语族8,390万人。土耳其语(4,000万人),乌兹别克语(1,100万人),阿塞拜疆语(840万人),哈萨克语(670万人),鞑靼语(590
万人),维吾尔语(560万人),土库曼语(190万人),楚瓦什语(170万人),吉尔吉斯语(150万人),巴什基尔语(120万人)。
B.蒙古语族400万人。包括喀尔喀方言、布里亚特方言、内蒙方言等。
C.通古斯语族包括满族语等,现有人数不到100万。
突厥语从公元7世纪起有碑铭;蒙古语从13世纪起有文字记载;女真语从12世纪、满语从16世纪起有文字。
(5)乌拉尔语系
两个语族,总人口2,210万人。
A.芬兰语族810万人。芬兰语(480万人),摩尔多瓦语(130万人),爱沙尼亚语(100万人),帕尔米亚语(又称科密语,100万人)。
B.乌戈尔语族1,400万人。匈牙利语(1,340万人)汉提-曼西语。
有的语言学家认为乌拉尔诸语言跟阿尔泰诸语言都属于同一语系。匈牙利语从13世纪、帕尔米亚语从14世纪、芬兰语和爱沙尼亚语从16世纪起才有
文献。
(6)尼日尔-刚果语系3个语族,总人口11,000万。
A.西苏丹语族4,600万人。约鲁巴语(1,220万人),弗拉尼语(1,000万人),伊博语(800万人),莫西语(300万人),马林凯语(200万人),特威语(200万人),芳蒂语(200万人),埃维语(175万人),沃洛夫语(150万人),班巴拉语
(150万人),丰语(100万人),门得语(100万人)。
B.刚果语族6,300万人。斯瓦希里语(1,000万人),卢旺达语(500万人),祖鲁语(500万人),隆迪语(400万人),绍纳语(400万人),柯萨语(400万人),姆崩杜语(350万人),尼昂加语(325万人),金瓜纳语(300万人),卢巴语(300万人),刚果语(280万人),索托语(250万人),茨瓦纳语(250万人),马库阿语(250万人),蒙戈语(200万人),吉库犹语(200万人),干达语(200万人),斯威士语(104万人)。
C.东部语族桑戈语(100万人)。
(7)马来-玻里尼西语系(又称为南岛语系)
两个语族,总人125,000万人。
A.印度尼西亚语族24,700万人。印尼语
(13,000万人),爪哇语(4,500万人),巽他语(1,300万人),米沙焉语(1,250万人),他加录语(1,000万人),马都拉语(800万人),马来语(730万人),马达加斯加语(700万人),米南卡包语(300万人),依洛卡诺语(300万人),布金语(250万人),比科尔语(200万人),阿钦语(200万人),巴塔克语(150万人)。
古代爪哇语(加维语)从9世纪开始有文献记录。
B.玻里尼西语族人数虽少,但散布在广阔的太平洋各群岛上。如萨莫亚群岛(15万人)、社会群岛(10万人)、汤加群岛(8万人)等等。此外
还有美拉尼西语和密罗尼西语。
(8)德拉维达语系
分布在印度南部。总人口14,650万人。包括:泰卢固语(5,200万人),素米尔语(4,700万人),卡纳雷语(2.200万人),马拉亚兰语(2,200万人),冈迪语(150万人),库鲁克语(100万人),图卢语(100万人)。
泰米尔语的文献是全印度除梵文以外最古老最丰富的,从公元4世纪起有记录。卡纳雷语有5世纪的碑铭和9世纪的诗歌。泰卢固语从11世纪起有文献。
除了以上八大语系以外,还有一些使用人数很多的语言至今难以确定语系:日本语(11,650万人)。
朝鲜语(5,660万人),有人把它列入阿尔泰语系。
越南语(4,730万人)有人把它列入汉藏语系。