汉字到底有多少?
古今汉字总共有多少?到目前为止,恐怕没人能够给出精确的数字,因为这与字形标准的认定、统计方法等诸多因素有关,但是,从古今字数的角度去研讨统计一下,对于学习汉字还是大有裨益的。
古今汉字的数量,总体上是逐步增加的,字数虽然不断增加,为什么不像背诵英语单词那样让人感觉到学习负担增加了,这是因为汉字本身具有新陈代谢的机能,因此,各个历史时期的常用汉字,都大致保持在5000字左右。
甲骨文和金文的字数
甲骨文指商朝用于占卜记事而在龟甲或兽骨上契刻的文字,从1899年被古董商、金石学家王懿荣发现,到现在满120年了,已经发掘出15万片以上的甲骨,分析出大约4500个独立的单字,其中公认能够识读出来的只有1500字。
商代晚期才出现带铭文的青铜器,但是字数不多,目前没有发现铭文超过50字的商代青铜器。
西周时期的青铜器字数开始增多,其中著名的西周晚期毛公鼎有497个字,堪称金文中的鸿篇巨制。
西周晚期毛公鼎,现藏于“台北故宫博物院”
铭文共497字,记叙周宣王即位之初,其叔父毛公因勤政治国而获赠厚赐,毛公因此铸鼎传示子孙
容庚(1894-1983年)先生的《金文编》收字3722个,其中可识别字2420个,未识别附录1352个。
社科院考古所集体编撰的《殷周金文集成》,搜罗古今中外铭文拓本12000片,据张亚初(1936-2002年)先生的《殷周金文集成引得》统计,共归纳整理出金文单字4972个。
这样推测,加上未被识别和未被发现的字,在战国之前使用的汉字应该大大多于5000字。
战国时期各国文字各自发展,新字形和新造字明显增加。秦统一六国之后,推行了文字规范化措施,即“书同文”,以秦小篆和隶书作为标准字体,考古挖掘见到的战国至西汉初期简帛数量众多,很多还在整理、辨识之中,尚未见到相关的战国时期字数统计数据,只能通过流传后世的字典推测。
历代字典中的字数
历代字典收录的字数,总体趋势是逐步增加的。
秦代的《仓颉》《博学》《爰历》三篇共有3300字,汉代扬雄作《训纂篇》,有5340字。早期的字书仅是用来规范字形的识字教材,没有字义解释,并且大多数都佚失了,保存下来较早的是西汉中期《急就篇》。
甘肃玉门花海汉简《仓颉篇》
东汉许慎的《说文解字》,是中国第一部系统分析汉字字形的字典,共分540个部首,收字9353个,另有“重文”(古文、异体字等)1163个,共10516字。
东汉许慎《说文解字》
汉代以后,历代字书收录的文字,日渐增繁。
晋代吕忱作《字林》,收字12824个(原书佚失)。
梁朝顾野王作《玉篇》,收字16917字(原书佚失,残卷现存日本),唐代孙强增字本《玉篇》收字22561个。
宋代的《类篇》收字31319个,《集韵》收字32381个。
清代《康熙字典》收字47000个。
1990年出版的《汉语大字典》,收字54678个。
历朝历代官刻私印的图书中,还有大量不规范的异体字、俗体字,若加上这些字典外的字形,总计会有8万~10万个汉字字形。
《汉语大字典》目前较权威的字典
一般来说,字典收录的字,与某个时期实际使用的字之间,是有误差的:一方面会失收一些字,例如,《说文解字》以小篆字形为标准正体,对于秦末到西汉间汉隶产生的一些俗体字和新字则不收;另一方面,字典又会收录很多前代的生僻字、死字,越往后的字典,这种情况越普遍。
那么,能不能采用另外一种办法,直接采样汉代典籍文献,统计里面使用字数的情况呢?
答案是否定的。首先,我们现在看到的汉代典籍,最早的也是宋代印刷术普及之后的版本,而且还很珍贵稀缺,当时以汉隶写在简帛上的文献,考古发现还很少。其次,现行的汉代典籍,其中的文字多经过后人的转写,与汉代实际流通的版本会有很大差异。
古代的字典分为字书和韵书两类。韵书按照字音的韵目编排,主要作用是规范文字的正确读音,兼有字义的解释,代表作是隋代的《切韵》(已佚失)和唐代的《广韵》。
唐写本《切韵》残卷
古代典籍的用字统计
以十三经和二十四史等为代表的经史典籍,是主要的训诂材料,也是字典收字的重要依据。
古人著述,对于每一个字都心存诚敬,会一个个字去数清楚。例如,许慎在《说文解字·后序》中说:“凡十五卷,十三万三千四百四十一字。”司马迁在《史记·太史公自序》中说:“凡百三十篇,五十二万六千五百字”。
儒家的十三经,包括《周易》《尚书》《诗经》《周礼》《仪礼》《礼记》《春秋左传》《春秋公羊传》《春秋穀梁传》《论语》《孝经》《尔雅》《孟子》,是南宋时期才形成的,最后加入的是《孟子》,十三经总字数约59万字,使用单字6544个。
其中,《诗经》是中国第一部诗歌总集,收录西周初年至春秋中叶大约五百多年的诗歌305篇。《诗经》是汉字和汉语的重要源头,全文30445字,使用单字约3000个。
《诗经》毛诗诂训传,宋代巾箱本
《论语》成书于战国早期,是由孔子弟子及再传弟子编辑的语录集,可能是一部中国历史上流传和影响最广的书,全书共20篇,492章,15923字(不计篇名),使用单字仅1344个。
《四书》包括《大学》《中庸》《论语》《孟子》,其中,《大学》《中庸》是儒家经典《礼记》中的两篇文章,南宋朱熹将它们汇集在一起,并且作了《四书集注》,明清之时是官订唯一教科书,影响近千年。《四书》全文56000字,使用单字4466个。
下面看看史学经典,最早最著名的是“前四史”。
《史记》是中国历史上第一部纪传体通史,“二十四史”之首,作者司马迁被尊称为太史公,鲁迅誉为“史家之绝唱,无韵之《离骚》”。《史记》成书于公元前93年,总字数533505字(和太史公自己在书中统计的字数略有出入),使用单字5122个。
西汉司马迁《史记》
《汉书》由东汉班彪、班固父子编著,班固死后,其妹班昭续写,公元83年成书,总字数742298字,使用单字5833个。
《三国志》由西晋陈寿编著,记载三国时期魏、蜀、吴三国的历史,取材精审,文辞简约,成书于公元289年,总字数377803字,使用单字4388个。
《后汉书》由南朝刘宋朝的范晔编撰,后汉即东汉,范晔综合了当时流传的七部后汉史料,于公元488年完成,总字数894020字,使用单字6161个。
普通人应该掌握多少字?
除了关注汉字数量之外,实际使用中的个人掌握能力和运用质量其实更重要;另外,规范用字和规范书写,从汉代开始就非常重视了。
汉代对于识字、认字、写字曾经有法定的要求。
汉朝的法令规定,各地方的学童17岁以后开始应考,能够认读9000个汉字的人,才能做文书小吏;然后进一步参加州郡中的大篆、小篆、刻符书、虫书、摹印、署书、殳书、隶书“八体”的书写考试,通过考试之后,再进京参加中央太史令的考试,成绩最优的人,被录用为枢秘处的秘书。
秘书们除了自己撰写奏章外,还担负着文字纠察官的作用,官吏的公文奏章如果文字书写不正确,尚书史有权检举、弹劾他们。但是,到东汉中后期,律令虽在,文字的讲习、传承和考核,就已经不受重视了。
现在,汉字的使用规范有《中华人民共和国国家通用语言文字法》,2013年发布的《通用规范汉字表》是目前最新、最权威的规范,共收字8105个。一级字表收字3500个,主要满足基础教育和文化普及。二级字表收字3000个。一、二级字表合计6500字,可以满足大多数出版印刷和信息处理的用字需要。三级字表收字1605个,多是姓氏、人名、地名专用字和生僻字。
《通用规范汉字表》,共收字8105个
大致而言,普通人应该认识4000~5000个字,掌握和使用3000字;文史及相关专业人员应该认识8000个字,掌握和使用4000~5000字。