数据库快速发展,传统图书目录仍有价值
2015年2月,民国时期文献保护工作办公室为展示民国时期文献普查工作取得的重要成果,让学界尽早共享普查成果,启动了《民国时期图书总目》编纂工作。
《民国时期图书总目》主要收录1911年至1949年9月我国出版的中文图书,基本依据《中国图书馆分类法(第四版)》体系,按学科分为哲学、宗教、社会科学总论、政治、法律、军事、经济、语言文字等18个分卷。其涵盖的收藏单位近60家,所收录的图书数据预计有20余万种,可以说是现阶段收录民国图书数据最多的目录。
2018年,《民国时期图书总目》的“哲学卷”出版;2019年12月,“社会科学总论卷”出版;2020年,“自然科学(基础科学)卷”及“农业科学卷”相继出版;2021年,“宗教卷”完成出版。截至目前,该系列图书已出版5卷,著录书目数据2万余种。
上世纪八九十年代,我社曾出版过一套《民国时期总书目》,收录图书12万余种,是当时最优秀的综合性书目之一,时至今日,该书的编印质量依然广受好评。由于条件所限,这部书目主要收录了当时的北京图书馆、上海图书馆、重庆图书馆的藏书,收录范围和数据量存在一定局限。
凭借全国范围的民国文献普查、成熟的组织协调体系、专业的编纂团队、现代化的目录搜集处理程序、便捷的图书数据库等,《民国时期图书总目》在继承《民国时期总书目》优良传统的基础上实现了大突破。主要体现在收藏单位的代表性、书目数据的完整性、著录内容的准确性三个方面:
一是收藏单位的代表性。《民国时期图书总目》借助全国范围的民国文献普查,扩大了收藏单位范围,收录了全国几乎所有省级公共图书馆的民国文献数据,吸收了大学数字图书馆国际合作计划(China Academic Digital Associative Library,CADAL)的主要高校成员馆,以及一些地市级公共图书馆、专业图书馆等各类民国时期文献主要收藏机构的数据。截至2018年4月,《民国时期图书总目》的文献收藏单位已经近60家,而《民国时期总书目》主要收录了当时的北京图书馆、上海图书馆、重庆图书馆三家单位的数据,因此《民国时期图书总目》在所覆盖的收藏单位数量和代表性上都大大超越了《民国时期总书目》。
二是书目数据的完整性。由于吸纳的收藏单位范围广,《民国时期图书总目》所收录的数据量预计有20余万种,不仅比《民国时期总书目》的12万种数据增加一倍,也将是现阶段收录民国图书数据最多的目录。《民国时期图书总目》编者曾做过比对工作,以“哲学卷”为例,本次著录数据4830种,其中有1200多种是《民国时期总书目》未著录的。同时,随着各单位编目的不断完善,以及线上丰富易查的图书书影,《民国时期图书总目》在每种数据的著录内容上也更加完备,能更好地反映民国时期的图书出版概貌。
三是著录内容的准确性。在保证内容的准确性方面,我社的《民国图书数据库》发挥了巨大作用。该数据库五期收录图书20万种,书目信息著录准确,书影收录完整,总计3500万页,全部图书实现全文检索,可检索的字数超过100亿字。编者在审校数据阶段、责编在编辑审校阶段都充分利用了这个数据库,查核使用非常方便,发现并解决了不少之前的著录错误,使得本次《民国时期图书总目》在著录内容的准确性上也前进了一大步。
相信《民国时期图书总目》各卷书目的出版面世必将对民国时期学术研究有重大参考价值,对民国时期文献保护等诸多领域也会起到重大的推动作用。
此次新编的《民国时期图书总目》“哲学卷”等5个分卷出版后受到了许多好评。不过,我们也听到一种声音,他们认为已经有囊括海量书刊的全文数据库,随时随地方便检索,制作传统的图书目录可能已经没有必要;而且纸质图书一旦出版就难以修改,与数据库的及时更新相比,更是高下立见,做纸质目录反而浪费资源。
全文数据库的制作是近年数字资源开发的大趋势,发展迅速。比如上文所介绍的我社《民国图书数据库》,收录20万种图书,3500万页书影,可检索的字数超过100亿字。这是多么惊人的数字!
在全文数据库快速发展的时代,编制传统的图书目录还有没有价值?
我日常的主要工作就是编辑出版各类古籍目录和民国图书目录,说实话,最开始听到这样的议论时,也觉得很惶恐。不过,当静下来,认真思考这些目录存在的意义,我反而意识到它们具有自己独特的存在价值。
专业人士的读书心得大概都有这样两条:阅读正文之前要先看目录,了解该书的大纲框架,体会作者的创作逻辑;参考文献不能忽视,若想深入研究该书的相关知识,那么首先根据作者精挑细选的参考文献进行研读,就是不二的选择了。
一本书的目录和参考文献尚且如此重要,那么一个学科、一个地域、一个时代的图书目录,它的作用更是不容小觑。个人认为传统图书目录主要有以下几个优势:
一是知识地图。高质量的传统图书目录,就像巨人的肩膀,读者站在上面,即可以领略全部知识的风采。它们有科学、准确的分类,便于读者形成对某领域知识的整体认知,是入门的基础。拿“哲学卷”来说,它给读者呈现了整个民国时期哲学类图书出版的概况,通过多级类目,将民国时期哲学类图书的轮廓、框架、枝脉、细节,递次清晰展现,是读者学习和研究的绝佳指引,可以说是一份全局性的知识地图。
我们对全文数据库等数字资源的使用,很多时候就是为了寻找某个问题的答案。传统图书目录便于从大处着眼,数据库擅长解决具体问题,这是两者的一个大不同。
二是效率利器。全文数据库的一大优点是它的“博”。不仅广收数据,还配有全文书影,并且不断更新壮大,使读者不出门便可查天下书。
传统图书目录在数量上没有优势,不过它的优势在于“精”。正是因为容量有限、难以修改,所以最终出版的目录在数据条目的取舍上剔重合并,在著录内容的选择上去粗取精,最大程度避免无效信息,同样有效节省读者时间。
全文数据库的“博”,可以完美胜任查找检索任务;传统图书目录的“精”,则为了解概况、初学入门提供最优路径。
三是研究入口。若想要到全文数据库中搜索捕捉信息,首先得知道检索词,不然再庞大的数据库也是无从下手。
清代史学家王鸣盛说:“目录之学,学中第一紧要事,必从此问途,方能得其门而入。”传统图书目录纲举目张,内容高度集中,为学术研究提供了大量入口,是创意想法萌生的沃土。翻开“哲学”卷,既可以对民国时期哲学文献出版特点进行综合性研究,还可以对每一个小类目进行专题研究;可以对一本书、一个作者进行深入研究,也可以做几本书、几个作者的横向比较;可以从出版的方向论述一本书的出版史、一个出版机构的变迁,也可以分析不同时期出版内容的侧重。“哲学”卷能提供的学术指引,不胜枚举。
全文数据库检索方便,是学术发展的加速器;传统图书目录提供多重入口,是学术研究的起点。二者各有所长。
全文数据库等网络资源飞速发展,传统图书目录的出版形势更加严峻。数据量要更全面、更充分,内容要更准确、更严谨,分类要更专业、更细致,这都是传统图书目录面临的新要求、新挑战。只有满足了这些需求,它才能更好地在数字时代发挥自己应有的作用。
数字时代给传统图书目录带来了这么严苛的生存环境,传统图书目录也可以反过来驯化时代,跟随时代趋势,与数据库等数字资源有机结合,实现1+1>2的超越,为学术研究提供更高效的服务。
或许,有一天数字资源技术的高速发展进入了崭新的时代,与虚拟现实、人工智能等技术紧密关连,使数字资源完美融合传统图书目录的长处,真正实现无书胜有书。
我们对技术发展充满期待,不过巨变不是一夜完成,我们能做的、应该做的就是做出符合时代要求的好目录、好图书、好产品,并不断精进。如此,我想我们不会掉队,好产品永远不会被抛弃。