中文面向对象的编程特性将让其成世界文

在计算机编程世界里支持面向对象编程的语言至少有Java,Objective-C,C++,C#,PHP等正被多数程序员使用,有三大特性:封装性、多态性、继承性。封装隐藏实现细节,使代码模块化;继承方便扩展;而多态解决了事物关系中的紧偶合问题,其目的都是为了代码重用,以提高程序的可扩展性。

中文造字造词造句的规则也具有面向对象编程语言的特性:封装性、多态性、继承性,作为世界上使用人数最多的语言,随中国影响力重回第一并将长期引领世界,必将会成为世界通用文字,甚至未来人类飞向浩瀚宇宙和外星人交流的工具,未来的宇宙文将会是以汉字呈现为主字母标注发音为辅的混合语言。虽使用中文时我们感觉不到面向对象编程特性的存在,但不能否认其存在,下面举例说明各特性。

封装性

俗话说“物以群分,人以类聚”,我们把同一群或种类的事物具有共有的属性和行为描述封装在一起而形成结构体(类)。一个类就是一个封装了数据以及操作这些数据的代码逻辑实体。以Java编程语言来举例说明封装性,下面定义了一个名为“动物类”的类,它有个称做“名称”的属性和 称做“说话”的行为。

以上代码执行后会在屏幕上显示如下:

Java编程语言正是以上面的“封装性”为基础在软件世界里构建了一个个的对象来实现预定目标。把某领域的客观事物描述封装为对应的类后为我们研究事物之间的关系提供了方便可靠的工具,常见的类之间关系有:继承关系,聚合关系,关联关系,组合关系,依赖关系等。程序员不需了解类体内的实现细节,只需通过对象来调用类内某个行为方法即可实现某项功能,这就是类的封装性,目的是隐藏实现细节,实现模块化,以方便复用,减少再发明已有“轮子”,使得编码变简洁。“不发明已有轮子”这和中文造字造词里的思想如出一辙!

中文的造字组词规则里也有封装特性:

字的封装:

每个字都是方块形,被封装在一个方形区域里,正如上例里的Java类被封装在一对大括弧区域里形成封装类后才能实现编程的模块化,汉字也是模块化文字,每个汉字都是由一个个可拆分的模块组合而成,使用了平面上的两维空间,这是平面上能利用到的最大几何维度。可分为独体字和合体字。独体字或是象形字或是会意字,是对客观事物最形似的抽象。合体字也是用结构化方式造出:把独体字按照上下或左右或包围结构封装成字,合体字可以用一套形式化规则描述并创造出来。从古人造字开始一直就遵守这样的结构化规则,字一旦封装成型就非常稳定。就像各行业软件和计算机之间有一个编译器,独体字就是主客观世界和中文世界之间的映射符号(1)。理论上这套规则可以创造出千万级个字(2),但常用汉字数量很稳定,只有三四千,新字(新轮子)没有再被造出,即使现在科技日新月异的时代,三四千常用字足够对应层出不穷的各种新事物新概念,原因是造词也有面向对象编程的特性

而以英文为代表的字母文字却没有字的封装,由无任何实际意义的字母直接成词,只能从左至右一维直线方式书写,虽有词根一说,但词根只是某几个字母约定成俗的组合,这和汉字部首完全不同,即不象形又非指事,缺少由词根联想到事物的功能,而且词根多变形,甚至新词出现后才往某词根上做牵强附会的解释(3)。因为字母文字是为记录发音而生,发音多变导致拼写不稳定;又缺少“字”级拼写单位,所以必须源源不断创造或从其他文字里借用出新词,才能跟上时代的发展,词汇数量不断膨胀(4)。

词的封装:

中文里的词语除极少量音译词外,都不超过四个音,绝大部分是双音词和三音词,三四千常用字组合可以创造近乎无穷无尽的新词汇(2),也有一套封装规则,规律性更强,每个词语都由一个基本字扩展而来,只要知道了这个基本字的含义,就能联想或推测出该词语的意思。类似面向对象编程中类的关系一样,字和字之间也满足一些关系来组词:并列关系,修饰关系,补充关系,依赖关系等。举例如下:修饰关系: 在基本字基础上添加词缀(大多数的是前缀,极少数的是后缀),词缀和基本字构成修饰关系,比如:前缀式的有蜜蜂,蜂蜜,老鹰,读者,中医,重视....后缀式的比如:房子,车子,猛然......并列关系:两个基本含义相同或相反的字形成新词,比如:朋友,道路,来往,是非,爱好,矛盾......补充关系:后一个字是前一个字的补充说明,比如感动,泪奔,眼红,剃光,波霸......还有一些关系不再一一举例。总之,中文造词严格遵守词的封装规则,这样中文具有的一个优点是专业名词的壁垒很低,专业词汇和大众词汇是同一套词汇,没受过专业教育的普通民众,少量学习就能看懂专业书籍,因为中文词汇可以让人望文释义,不言而喻。

而以英文为代表的各表音文字用字母记录发音相对容易,这样导致大量新词的生成和外来词汇更容易进入英文体系(4),没有封装性导致词汇量不受节制的暴增,文字和含义的关联性较弱,望文识义能力不强。在物理化学医学生物学等专业领域里各有一套和生活词汇完全不一样的词汇(5),不知其来源,自成体系,互不来往,这样导致专业知识让用字母文字来传承和交流变得越发困难,不同专业的人所掌握的专业词汇有很大区别,很难深入交流,一个个庞大术语词汇生生的把生活用语割裂开来,知识只掌握在少数的专业人员手里。几百年后的英语最可能的结果是:因词汇过于繁杂、庞大而被放弃,仅在计算机等少数领域内发挥作用(6)。

句的封装

中文结构松散,多短句,短句的构造原则跟词的构造原则基本一致,甚至多数词就是某些短句的简称,比如:会采蜜的蜂子(蜜蜂),蜜蜂采集得到的蜜(蜂蜜) ,剃成了精光(剃光)。并且基本句型就一种:主谓宾(7),语法规则简单,字词无变形,多个短句联合表达出一个完整的意思。用编程术语来说中文造句规则就是封装为队列,队列里是短句。

英文重结构多长句,完全靠语法结构让词语粘贴耦合在一起,单词位置稍稍变动就破坏了语法关系导致无法断句和理解句意,一个英文长句子可能好几行,中间没有任何标点符号来断句,像极了中文以前无任何标点符号的文言文,里面还夹杂着it,that,which,why等谜式替代词。所以英文中需要非常多的语法规则和很多无实际意义的虚词来组织。

例如:

英文:The change met the technical requirements of the new age by engaging a large profess signal element and prevented the decline in efficiency that so commonly spoiled the fortunes of family firms in the second and third generation after the energetic founders.

中文:这一变化符合新时代的技术要求,采用了大量的职业信号元素,并防止了效率的下降,这种下降通常会破坏继精力充沛的创始人之后的第二代和第三代家族企业的财富。

上面例句里中文用了四个短句由标点符连接,每个短句都是基本的主谓宾结构,摒弃了繁琐的词汇变形,宾格主格之分,语法极其简单,所以中文句子可以用某种形式化的封装规则来描述,从而很容易地被计算机(人脑)分析处理(8)。这也是中文阅读时可以一目十行地扫阅,发生阅读障碍的人数很少的一个原因。

英文原句是常见的典型长句,中间无任何标点符号,and连接了两个并列但离得相当远的谓语,还用一个that来指代前面的decline,让本来不容易的断句更加不容易,为了理解这个句子意思,眼光必须来回移动好几次,让阅读更加不通畅。计算机(人脑)对字母文的处理要复杂很多,无法用某种形式化规则来分析处理。随着英文单词长度不断增加,英文越来越呈现出“超线性”特点,长句越来越长,段落越来越跳跃,文意越来越晦涩,阅读时很容易串行而产生阅读障碍,即使是他的受教育程度很高。尤其是学术性论文,断句越来越困难,非专业的普通民众几乎无法阅读。

继承性

继承是指创造某新类时在已有类基础上,建立子类和父类之间的层次关系,子类可以从其父类中继承属性和方法,扩展已存在的代码模块,通过这种关系模型可以简化类的定义。

继续以Java编程语言来举例说明继承性:下面定义了一个名为“人类”类,继承于“动物类”,有个称做“国籍”的属性和 称做“画图”的行为;它还继承有父类“动物类”的称为“名称”的属性 和 称做“说话”的行为。

以上代码执行后会在屏幕上显示两句话:

继承性的发明和使用极大地方便了功能的扩展,只需继承某类,子类就自动拥有了父类的功能,以达到描述同类新事物的目的,这和中文里造字遣词里的思想几乎一致!

中文里的继承性:

造字法里的继承性:

独体字不仅从古使用至今,而且大部分又是用来构成合体字的偏旁部件,用编程术语来说偏旁部首是合体字的基类。《部首名称表》列出的部首是99个,常用的有50多个偏旁,掌握了部首的用法就能很容易掌握一类字,触类旁通甚至无师自通,举例如下: 赞,贺,赢,赛,贴,赃, 贡, 赌、贞,贫,费,贤,责,赠,贵,质,货,贱,败,购,账,贩,负,财.... 都继承于贝,而贝的本义是海贝和它的图形抽象,曾经当做钱使用过,也是货币的本义,所以以贝为部首的汉字都与钱相关或其引申义。形声字都是这个规则,常用四千字里90%的都是形声字。人们掌握了现代汉语中频率最高的前950个汉字,就可读懂一般文章的90%。

而各表音文字使用少量字母(比如26个拉丁字母)记录语音的文字,要求吻合其一定口语,词之间的形状差异往往没有规则性。容易记录语音,这既是字母文字的特点,也是它们的最大缺点:很容易本地化,比如英语传入印度,已有词汇结合了本地语言口音产生了变音,新词也大量无规律的创造出来并倒灌入宗主国英语,一股咖喱味;传入韩国,一股泡菜味;这才多少年,就有了英式英语和美式英语的区别,使得人们陷入学习新词汇痛苦中而出不来,这和《孔乙己》里老秀才到死还在研究茴香豆的茴有七种写法没啥两样。几百年后的人们将不能阅读现在我们写的字母文字,正如我们现在已不能完全阅读几百年前莎士比亚写的剧本。

造词法里的继承性:

中文的词都在继承于某个基本字,用编程术语说就是某个字是某类词汇的基类,掌握了一个字就掌握了一簇词语,比如以牛为大类,则水牛、黄牛、奶牛、公牛、母牛、牦牛等都继承于牛;又比如:“火车”,一个没见过火车的人只要认识“火”和“车”,就能大致推导出火车是怎么回事,而且一通百通,“火车乘务员、火车站、火车车厢……”等这些与火车相关的词汇也能做到大致理解,同时对这些相关词汇的理解又能反过来帮助对火车的理解。汉语这种横向与纵向两维贯通的特性,最大限度地提高了学习的效率,保证了不同学科之间的交流,加速了科技进步。中文造字造词规则里的继承性也解决了大众化科普知识和小众化专业词汇之间的无缝衔接,中文和字母文字相比最大的优越性就是专业名词的壁垒最低,大部分人即使没受过专业教育,通过运用联想或关联记忆等方式,也能把看懂专业书籍。

以英文为代表的字母文缺少“字”级单位,导致没有能力使用继承性,比如:buffalo(水牛),cattle(黄牛),cow(奶牛),bull(公牛),calf(小牛),Yak(牦牛),Bison(野牛)......同一类型的事物却是不同并且无关联的多个词汇;即使英文模仿中文词创词规则,因为只能一维直线式的书写,也会无法胜任,比如:火fire,车vehicle,火车将是fireVehiche,火车乘务员将是fireVehicheAttendant,计算机将是computationalMachine,这种造词方式导致单词越来越长,所以只能是创造出一个长度较短的新词,比如train(火车),station(火车站),rocke火箭……,并且单词间并没有内在的逻辑联系,相互之间根本无法做到融会贯通;但适合发音的短词毕竟数量有限,总有用完的时候;减少单词长度的一个办法是使用缩写,但缩写又带来另一个严重问题:重复率太高并且本身没有含义导致更加难认,比如TNT常见的意思就有几十种,随着这些无规律的新词和缩写越来越多,使得英语越来越复杂,不仅限制了学习速度,而且加重了学习难度。这也是英文阅读障碍症产生的另一大主因。

汉字早期(甲骨文)时也和英语类似的问题,妄图用单个汉字去描绘某个事物,最多时汉字数量超过10多万,差点让汉字无法延续。但经过“六书”方法让造字有律可循,以及白话文运动和简化改革后获得了新生,已越来越适应当今时代的需求。而今天的英语还沉湎与过去汉字的错误思想却找不到有效解决方案。

造句法里的继承性:

不同于印欧语系有曲折变化的语言,中文词汇只有一种形式而没有复数、词性、时态、词格,性别(口语中)等变化,中文句子的基本类型就一种,即主谓宾。比如:我在吃饭,我吃饭了,我会吃饭,我吃饭吗?我不吃饭,我应该吃饭,都是继承于“我吃饭”的基本句型,只需新增副词来表达不同时态的诉求,以不变应万变。用编程术语来说主谓宾的基本句型是所有中文句子的顶级超类。

而拉丁字母为基础的表音文字所需要的语法规则也就相对应的要求越来越麻烦,比如英语有十六种时态,动词随时态要不同而变形,更要命的是这种变化和动词种类相关,这就大大增加了学习成本和使用效率;句子里的词汇必须符合语法规则,只能出现在它应该出现的地方,否则句子稍长就无法被人断句和理解。

多态性

多态的概念:从字面上看就是同一个东西的多种表态,即作用于不同对象的同一操作,可以有不同的解释而产生不同的执行结果。用编程术语说就是用基类的引用指向子类的对象。以Java编程语言来举例说明多态性: 下面定义的“人类”和“猿类”都继承于“动物类”,并且重写了其父类“动物类”的行为“说话”的实现方式。

在下面的执行过程里,“自然”在第6行创造”卜哥”和在第10行创造”大猩猩”时都声明为“动物类”, 在第7行和第11行不必理会实现细节,只管命令他们说话就行,到具体执行时才体现为他们实际的“说话”行为。

以上代码执行后会在屏幕上显示两句话:

“多态” 的思想就是:对外形式统一,实际各自表达。这和中文何其相似!

中文中的多态性表现在同音字,一词多义和词形不变。中文是词汇附着型语言,同一个字或词根据出现在不同位置或不同搭配即上下文关系来表达不同语义,所以中文除了字形上的二维外,还多了一维度来表达语义。比如:打,独立出现时只是其本义,但后面加一个字可以组成几百个新词(打水,打车,打针,打扮....),说者无意而听者有心,听者听到后面字后就明白了具体的意思。又比如:下属给上司送礼:一点小意思,请收下。上司:你这什么意思?下属:没别的意思,就是意思意思。上司:那多不好意思!下属:一点小意思。上司:这有点少啊,不够意思。表达者只管在形式上用一个词“意思”, 但接受者在收到不同词搭配时会释义为不同含义。语言学上称这种现象为多载语音,多载文字,即一音载多字,一字载多义,其中以中文为最。

而以英文法文为代表的表音文字多态性不强,只能增加音节或变形来表达某个事物的不同使用场景,导致表达同一个事物时口腔动作比用中文时多,比如:国际化:中文里做名词和做动词时词形不变,发音也不变,而英文时名词是internationalization,动词是internationlize,名词的发音比动词要多一个音节。

有人说中文太难学了。实际上只要学习与母语不是一个体系的新语言都是很难的,但中文里有这些面向对象编程的规则,学习这些规则确实需要不同于学习字母文的思维方式,一旦掌握了这个规则,如鱼得水,举一反三,并且使用终身。而西方拼音文字里的多态性不如中文里明显,这就要求使用者终身学习新词才能跟上时代步伐。

成语就是模式描述

面向对象编程语言因为封装性继承性多态性,具有了代码重用和可扩展性的基本能力,但因为事物的复杂性和多变性反应到编程世界依旧复杂,为解决问题“设计模式”被引入到设计中。最早总结出来的是1994 年时有四人合著《设计模式 - 可复用的面向对象软件元素》(中译名),书中定义的23个模式逐渐成为软件技术交流所必备的基础知识和语汇。设计模式方便了复用成熟解决方案,避免重复犯错与重复造轮。这又高度吻合中文的思想。

中文里也有编程领域的设计模式,成语和俗语就是中文世界里的设计模式,一个成语就是一个模式的总结和称谓,比如:张冠李戴,掩耳盗铃,南辕北辙.....成语的构成也是符合一套形式化规则:几乎都是四个字组合而成固定短语。结构固定,不能任意变动词序增减语素,只能作为一个整体被使用;含义固定,一段历史故事或一副记事画卷被浓缩在一个四字短语里,生动简洁并且形象鲜明,既具象又抽象,四个字就高度概括某个场景,精炼到了极致。这套成语已经深入我们的文化生活中,某些成语只要一出现,每个人脑海里就会出现它们对应的固定场景,这也是托起中文世界里共同的文化共鸣。中文有几千年的历史,文化沉淀很多,所以成语数量多,描述的意境丰富。这也是在同样长度大小的文字里,中文能传播信息数量最多的原因之一。

一般来说,学习简单事物都容易,学习复杂事物都困难。英语的出现和传播随大航海时代出现才几百年的东西,所以英语里沉淀的东西和中文比少多了,因而学习字母文时的入门条件相对容易,而学习与其母语不是同一语系的中文入门难度较大,尤其学习成语时,因为他已经不是在单纯的学习中文语言,而是已经在学习中国文化,但是学习中国文化和学习中文几乎是同时进行的,反而从整体上学习效率要高于学习字母文,这就是外国人在中国更容易被同化的原因之一。

音义分离,一字一音

中文是现在世界上主流文字中唯一表意文字,诞生之时的甲骨文就不是为了记录语音而生,而是为了祭祀或者说是与祖先或神沟通的工具。音义分离,这是中文的一大创举,又是统一文字的基础。字母文字拼写必须吻合口语发音导致读写不分离,发音无法统一导致拼写无法统一。字母记录声音成本低,殖民扩展加速了英语本地化,以至于任何一门语言都可以轻松用其创造本族文字,又帮助了英语国际化,但大量外来词和新词潮水般涌入时导致英语杂交化和复杂化,字母使各族文字更加无法统一,它原先一切优势变成了劣势,必然造成沟通上的更加混乱。可以说字母是欧洲分裂之源,即使秦始皇似的人物出现在欧洲,也无法统一文字,最多统一字母(9)。

人类口腔里能发出的声音种类总是有限的,中文又创造性地使用了声调,口腔动作不变,发出来的声音却增加到了四倍。即使这样,所以中文仍有较多的同音字和同声词,但多态性的使用较为完美的解决了此问题,通过上下文词汇的搭配关系来扩展含义或消除歧义。但其他字母文却是另外一种解决方式:通过增加音节来区分,即口腔要多做运动才能表达出相应的意思,于是引入了重音、连读、轻读、弱读、略读等各种规则,需要大量练习才能掌握,母语为非拉丁语系的人学习起来不比学中文的难度要低。没有这些发音规则的约束,在中文世界里人们看视频时可以用2倍速度快进并配合字幕来接受处理信息没一点问题,而字母文字就无法胜任。这就是中文在移动互联网时代更有优势的原因。

汉字作为现存主流文字里唯一的象形文字,每一个汉字都蕴藏着不寻常的美。简单的线条勾勒创造出复杂的视觉形象,具有形美;声调读来抑扬顿挫,掷地有声,具有声美;声音穿透力强,在噪音环境下识别率更高。汉字之美是在于皮,在于骨,在于灵魂。

中文有能力成为世界文

未来的世界文应该要符合这样的一个标准:构词成本低:以记录信息爆炸般的新事物;学习成本低:在有限生命周期内能让人掌握更多的知识,即学少而知多。

英文等字母文不能成为世界文。字母文字因显而易见的缺点,已走进了进化的死胡同,越来越不堪负重,无法应对现代社会层出不穷的新事物,伴随着未来的科技爆发,越来越多的新词汇将会被创造出来。

汉语其实比英语更具有优势,全世界在以人工智能、大数据为主流的未来,都将使用一种以汉字记录呈现为主字母标注发音为辅的混合语言。中文因面向对象的编程特性相比其他字母文字,能让客观事物更容易通过汉字平滑映射到主观世界(10),符合未来世界文的要求标准。

早在二千多年前已在中国实践了:春秋战国及以前诸侯林立,南蛮北夷东狄西戎,地理巨大差异下孕育出来大小民族何其多,最终只用简单线条和规律造字一统为汉字,自此地不分东西南北,人不分男女老幼,言不分南腔北调,无论山有多高路有多远,都用同一套文字系统记录事物,最终确立文化认同、民族认同、国家认同。即使现在东西南北中一些方言之间基本不能直接交流,比如邵阳和益阳相距不到三百公里,彼此却无法直接对话,但使用汉字却不妨碍两地人民看写交流。如果是字母文字,那就是一堆密密麻麻的分裂小国,看看现在的欧洲!

中国方言差距如此之大都能用汉字统一,当然也可推广到全球,实际上汉字还曾是东亚地区唯一的国际交流文字,20世纪前仍是日本朝鲜越南琉球等国家的官方书面规范文字。因为日,月,山,人,口,马,鸟,羊,牛……所指无论在地球哪里看到的都是一样的,并由此派生出来的各相关字词,比如'鸟'类事物对应的文字是鸡,鸭,鹅,鸵,窎,鹃,鹦,鹏,鹉、鸠、鹤、鹄、鸾、鸵、鹩、鹪、鸱、鹳、鹬、鹢、鹓、鹀、鸯、鸰、鸮、鹝…虽发音不同,但不阻碍各人的读解。我敢肯定不出一千年,沒人知道bird是啥意思,但可肯定知道'鸟'啥意思,就算所有鸟都灭绝,“鸟”还是鸟。未来某星球上人类先锋发现一动物,向地球发回来某字:鹱,无需多言一目了然,是一种鸟类动物,如果英美先锋发回来某 字: partridge,将更加混乱。

中文成为世界文已开始起步

最近日本出现了一种新型文化交流方式,将日文全部清除掉,只留下汉字假名,双方居然可以互相进行交流。这种纯粹使用汉字的交流方式,已经逐渐开始在日本流行,这昭示着汉字的强大生命力和包容性,它是一个极为科学文化传载手段,理应广为传播。

《中日韩共同常用八百汉字表》已选定808汉字作为三国共同的常用字,这样三国人民已开始“笔谈”,方便旅游和增进交流,为互相学习彼此文化提供方便。

在电力特高压领域里全世界都要用中文,因为该领域里中国标准就是世界标准,所有的新技术委员会委员全都是中国人,所有相关技术和产品设备都在中国。其他国家包括美国,要么自研,要么使用中国的,而美国产业已空心化和只为资本服务,要自研出来已无可能。再过二十年中国在每个关键领域(高铁,人造太阳,供应链,无人机,导航,美食,文化......)都发展到和特高压电力一样无法拒绝的利益。当中国产品出口时不再标注为“Made In China”而是“中国制造”时,中文就已开始了世界文的使命。理由很简单:利益驱动,学中文好赚钱。英语的国际化伴随着征服和血腥,而中文国际化是世界的主动选择,所以这次必将来得要更猛烈些。

中文成为世界文后让沟通效率最高

中文经过几千年的改进沉淀,抛弃冗余,没有时态,单复数,字词变形,男女之分(口语)以及主格宾格,化繁为简,很多术语都是简单明了的普通字组成,所见即所得,相比英文单词的各种变形省去很多麻烦。从影响文字效率的几个因素来比较,中文的效率最高,中文领先英文55%,领先日文65%。

同样大小面积上书写文字,和字母文字比中文包括的信息密度最大(数学公式>中文文言文>中文普通话>其他字母文字),一个汉字中的平均熵值为9.65比特,而英文字母的平均熵值才4.03比特,即同等面积的文字,汉字传递的信息要比英文高两倍以上;同等距离下视觉分辨率也是最大。生活中的公告牌,路牌等上面的英文标识超过20米就模糊不清,但中文标识可以在50米外甚至100米外照看不误。中文抗操性强,可以横写竖写,从左到右写从右到左写,而英文只能从左到右的横写,竖写不利于书写连接也不便于构成单词和不易识别。下面站牌上的中文依然可以分辨而旁边的字母文字已经模糊不清了,并且必须歪头看才能识辩出竖写的字母文。

现在的网络空间里已不再是单纯文字显示时代,而是文字图片视频多种形式显示在屏幕上。在视频上使用字幕和弹幕的只有使用汉字的中文和日文,其他文字无法使用因而体会不到字幕和弹幕带来的乐趣,以及更高的社交舒适度和更多的信息获取量,因为在同样的符号长度下,汉字所负载的信息量明显高于其他语言,这也就使得言简意赅、内涵丰富的弹幕出现在屏幕而不影响信息的获取。虽然英文里也有许多缩写词汇,但屏幕上单位面积内能呈现的信息量远低于汉字的,当满屏幕英文弹幕铺满时,因为扫读困难和视读效率低,导致很难快速从中抓取到相应的信息,反而很容易看得头晕眼花。

这种弹幕不正是未来登陆外星时在宇航服头罩上或眼镜上视线合成展示的必备工具么?中文做好了成为宇宙文的准备。

扩展描述说明

(1) 独体字是主客观世界在中文世界之间的映射符:

计算机的最底层由电子正负极(01码)构成的逻辑开关系统来实现功能的,计算机软件编写时由人能识别的语言(比如本文中的Java编程语言)来编写,被编译器编译为计算机能识别01码。日,月,山,水,上,下,大,小….等象形字或会意字就是客观世界反映在中文世界里基本元素。无论在地球还是某星球上这些基本物件不会改变,这也是中文字形稳定的基础。

(2) 这套规则可以创造出千万级个字:《在线新华字典》里收录256个独体字。只按三个独体字形成一个合体字,能有256*256*256=千万级。四千常用汉字,理论上可以组合出近乎无穷无尽的词汇,一字词:4000个;二字词:4000²=1600万个;三字词:4000³=640亿个;四字词,4000^4=2560000亿个。

(3) 比如《逻辑英语》里解释如下:propose v.求婚 。 pro前缀“向前”,pose词根“放”。 把戒指向前放是“求婚”.....完全牵强附会的解释,pro为啥是“向前”,“向前”不是forward么? progress(进步)的词根pro是向前的话,procrastinate(拖延)里的pro又做何解释,proabortionist (赞成堕胎者)呢。会发现英文毫无逻辑,越学越糊涂。为了记忆这个单词把它们当做助记词倒是可以,但不能把它们当做普遍规律。《逻辑英语》一点也不逻辑,牵强附会之英语。

(4) (英文)词汇数量不断膨胀:英语新词增长速度约为每年1万个,让英语变得越来越臃肿,来源于出现的新事物或其它语言中引入词汇,比如从中文引入的fengshui风水、kongfu功夫、tuhao土豪等,从日语引入的ninja忍者、Okuni艺伎、Sumo相扑,英文单词已经超过一百多万,而且还在持续高速增长。英文,已踏上词汇增长不归路;而中文则以不变应万变!要么借鉴汉字思想,要么消亡。

(5) 在专业领域里各有一套和生活词汇完全不一样的词汇:英语的历史就是一部被入侵史或入侵史,大部分时间里统治阶层和被统治阶层都不说同一种语言,所以英语吸收了大量外来词,这就是英语词汇间关系为何如此混乱的原因。比如:lung(肺),inflammation(炎) ,pneumonia(肺炎)却是与肺和炎都无关联的词,tooth(牙齿),doctor(医生) ,dentist(牙医)却是另外一来源的词。

(6) 英文将仅在计算机等少数领域内发挥作用:英文之所以能首先出现在计算机领域里,与它的书写方式有关:只能从左至右一维直线方式用26个字母书写,是一种相对简单的方式,计算机的底层就是电子正负极(01码)构成的,因此简单的字母方式用来构建的计算机编译器就相对简单。但现在计算机技术已发展到图形智能时代,英文一维直线书写方式反而成了劣势。一维直线书写方式在输入效率,识别效率,信息密度,文艺创新等方面明显比中文落后。

(7) 祈使句也可归结为主谓宾的句型,只是省略了主语。比如:立正!可以认为是 你立正。

我们把狼打死了,本质也是主谓宾的句型,只是宾语用“把”提到谓语前面。

狼被我们打死了,本质也是主谓宾的句型,只是宾语用“被”提到谓语前面。

(8) 中文很容易地被计算机(人脑)分析处理:下面用Java编程实现了对中文句子的一种简单分析算法,因为短句也大致符合主谓宾的结构,也可以用一套规则分析出来,这里篇幅原因不展开描述。现实中在计算机来分析各类自然语言时,分析中文的算法是相对简单的。

以上代码执行后会在屏幕上显示如下:

(9) 即使秦始皇似的人物出现在欧洲,也无法统一文字,最多统一26个字母:

现在英文法文德文西班牙文等使用26个拉丁字母,俄文、乌克兰、塞尔维亚等使用 33个斯拉夫字母(西里尔字母),而希腊语使用24个希腊字母。

(10) 能让客观事物更容易通过汉字平滑映射到主观世界:日,月,山,水,上,下,大,小….等象形字或会意字就是客观世界反映在中文世界里基本粒子,无论在地球还是某星球上这些基本物件不会改变。

参考文档

《从汉语篇幅差异比较汉英语的信息密度》瞿宗德外国语(上海外国语大学学报)1998年第3期(总第115期)

《通用规范汉字独体字研究》 李瑛 内蒙古师范大学学报(哲学社会科学版)2016年5月

《英中新词汇对比:英文膨胀无止境,中文不变应万变》

《为什么汉语千百年来新造字寥寥无几而英语却以百万记?》

《汉字的造词思想充满智慧,也许能给英文进化以启示》

《从美国学生学习能力退化,看中文和英文谁是更好的学习工具?》

《面向对象中常见的几种类之间的关系》

《汉语新词语修辞方式造词法研究》

《英语和汉语的十大区别》

《五种文字识别效率对比:中文领先英文55%,领先日文65%》

百度百科:《设计模式 - 可复用的面向对象软件元素》

(0)

相关推荐