一篇文章发表403个新种是搞笑?
著名分类学杂志Zookeys在本周发表了一篇名为《极简主义者的分类学修订及403个来自哥斯达黎加的茧蜂科新种》的文章 。这篇文章光看标题就很吓人,一些分类学者究其一生都没有完成过的数量,居然一篇文章就搞定?点开文章明白了作者们为啥在标题里加了“极简主义”这个奇怪的词之后,可能更让很多分类学者目瞪口呆。这403个新物种,没有完整的形态描述,大多数只附了一张照片和一串DNA序列,审稿人和杂志主编是脑子进水了么?
原文截图,最上边那一串ATGC就是DNA序列
为了理解为什么分类学者会目瞪口呆,我们得简单复习一下分类学,分类学顾名思义就是物种分门别类的学科,默认是指现代分类学,以林奈建立的物种双命名法为基础并不断完善,几乎每个被命名的物种都有一个统一的拉丁语化的学名。学名由属名,种加词,命名人,命名年四部分组成。统一的学名让不同地区的学者不会因为语言的不同产生鸡同鸭讲的效果。但因为理论上人人可以发表新物种,很多物种会被不同的人在不同时间不同地点分别发表。而根据命名法规简单理解(完整版的法规三天两夜也说不完),只有最先发表的名称才是这个物种的唯一学名,而其它的被称为异名或无效名。分类学家除了描述新物种,一个非常重要的部分就是对比和整理历史遗留的异名问题(分类学版的造谣一张嘴,辟谣跑断腿)。而整理异名最重要的手段便是对比模式标本或查模式标本的描述(发表学名和新物种时描述依照的原始标本就是模式标本)。如果两个不同学名下的模式标本得出了相同鉴定结果,那这两个“物种”其实是同一个,晚发表的学名就是异名。
命名法规条条框框可多了,而且学名的每个部分都可考,图里的例子是望天树Parashorea chinensis H.Wang, 的标准学名写法应该是 Parashorea chinensis Wang Hsie, 区别就在于H.Wang 是人名的缩写,但Wang Hsie不是人(没有骂人),而是好几个人,是“望天树协作组的简称”,而广西亚种的“Lin Chi”是“擎天树协作组”的简称。
套进了分类学的思维再来看这篇文章,你可能会产生同样的疑惑。这种一下子发表这么多新种,又没有对应的描述和图片会不会太草率,将来出了偏差,该给后世分类学造成多大的困扰,能付得起责任么?但我觉得很多人更介意的是新种的描述只用了DNA条形码而对形态描述一笔带过。所谓的DNA条形码是生物体内一段DNA比较短的序列,这段序列在物种内比较稳定,而物种间区别较大,通过对比这些序列能够确定物种的同异。对于昆虫来说,物种分辨率最高、最常用的DNA条形码是位于线粒体上的一段基因COI。这种以简便、上手零基础为卖点的技术手段因为种种漏洞往往为形态分类学者诟病,原文章的开头里讨论了更多DNA条形码的缺点,我就先列几条我研究食虫-寄生蜂关系时亲身体会到的:
1)首先是无法及时纠错,DNA测序一般先要从昆虫身上掰条胳膊扯根腿,之后所有的步骤都抽离标本,只通过标本的标签联系起来,假设出现了标签和样品混淆或者样品污染,你可以把蝗虫测成猫,而最后得到的DNA序列也只是一段ATGC的字母,是无法像形态鉴定一样通过肉眼直接看出端倪的。而不管如何小心,样品污染太普遍了,昆虫体内普遍存在共生细菌,最常见的便是Wolbachia沃尔巴克氏体。很多时候你以为你测到的是昆虫的DNA,实际上是这些细菌,而这些错误只有在把序列输入到条形码网站(Barcode of life database: BOLD)上查询时才会发现。
而这个条形码网站虽然有分类学家负责人工审核这些序列的实物标本是否鉴定正确,但百密一疏,对于一些冷门类群,网站上的序列对应的物种鉴定可能一开始就是错的。举个假设的例子,你要鉴定一只灰蝶,测序输入后发现99.9%的和网站上的锡冷雅灰蝶序列对应,本来是个毫无疑问的鉴定结果,但如果那条和你序列匹配的序列来源标本,实际上是错误鉴定呢?而如果发表新物种时更大的问题在于之前发表过的种类大多数都没有DNA序列信息,如何证明这个新种不是异名相当有挑战。
2)其次虽然COI是昆虫里最好用的DNA条形码,但这个结论是怎么来的呢,一般是分类学家把一堆已经被形态分类学分好了的种类DNA测序,看COI序列对形态学分类的还原度有多少,大部分的研究都发现COI的区分度可以接受。但并不是所有的类群都有这样的先验研究,也不是所有的先验研究都能发现COI是个好用的DNA条形码,研究已经发现一些昆虫是无法通过COI序列来区分的。
3)另外一个是条形码技术是个技术壁垒,对于发达国家的分类学家来说可能很方便,但如果对于发展中国家的分类学家,或者没有资金支持的分类爱好者来说想鉴定手里的一批物种,过去只需要找到原始描述文献或者分类修订文章里根据形态来的检索表对比就可以了。如果新种的原始描述是DNA条形码,就必须去找公司去测序,就得花钱了,而且因为上面的两条原因,不上网查都不知道是不是花了钱测了个猫。测序的价格和数量和是不是自己先处理好样品有关,越多越便宜,文章里提到的加拿大一个样品20人民币左右,我在国内拿到的报价是60-80左右,这得买多少个馍,我反正是没骨灰到自己花钱去测序列这个程度。
但这些问题都是可以讨论的,原文作者们详细的回答了这些疑问,有兴趣的可以看原文开头,文章的第一作沙奇(Michael sharkey)是个功力深厚的形态分类学家,从80年代就开始了南美洲的茧蜂科的研究,编写了1997年出版的《新大陆茧蜂科鉴属指南》。文章的第二作者赞森(Danial Janzen,就是Janzen-Connel那个Janzen)从70年代开始就开始在哥斯达黎加的雨林里饲养蝶蛾幼虫,文章里的茧蜂就是这几十年里十几万条蝶蛾幼虫饲养积累下来的。行态分类学出身的沙奇很清楚DNA条形码的局限,这403个新种都是经过他仔细对比过各大博物馆的模式标本形态后认定的(文章也同时处理了13个异名),异名的可能性很低,COI在茧蜂科里分种的有效性也是用形态分类验证过的了。而以他三十年来的形态分类经验来说很多种类形态上区分不大,但DNA序列有较大不同,再加上茧蜂科种类对寄主的选择专一性比较高,赞森的寄主数据是一个非常重要的补充 (类似于鸣声在鸟类分类上的作用)。因为只能靠寄主和DNA条形码来区分,在这种情况下图放了也是白放(所以大多数种类只是象征性的放了一张),这也是作者们选定用DNA条形码来代替形态描述的原因之一。
《新大陆茧蜂科鉴属指南》
作者们明明有详细形态描述的能力,但却花费了比纯形态描述更多的时间和金钱,更大的动力是文章的第二作者赞森近年来一直在游说政府所推动的事情:和形态分类学家合作,大规模野外测序,并和博物馆收藏的模式标本建立关系。越多的形态分类学家参与到这样的研究中,越能减少目前DNA条形码技术的缺陷和不足,尤其是前面说到的序列错误和物种分辨率不确定的问题。一旦这些问题随着更多形态分类学家的参与得到解决,DNA条形码的优势就发挥出来了,如果十年后再去哥斯达黎加调查茧蜂科来看多样性的变化,相比本文靠形态鉴定所花几年时间,可能只花不到一个月的时间,这样的便捷对于调查这些超级多样的昆虫类群的种群和多样性变化非常有用。
现在地球上的生物多样性正在受到前所未有的威胁,而在这种情况下,我们连最基本的多样性本地都没有搞清楚,更不要提如何量化生物多样性丧失了。文章里引述了2000到2011年,平均每年有460多个新的姬蜂科和茧蜂科物种被描述,作为膜翅目中种类最丰富的类群,按照现在的描述速度和多样性估计,大概在2561年到3843年之间我们就能描述完这两个类群了,而膜翅目只是昆虫几个多样超高类群里的一员。而在这样的背景下,分类学在全球范围内却受到排挤逐渐凋零,但让形态分类学家失业的并不是DNA条形码,而是政府对生物多样性本底信息的不重视。如果像这篇文章中这样使用得当,DNA条形码技术并不是形态分类的敌人,与其争辩谁优谁劣,两者更应该通力合作,共同应对全球生物多样性危机。
不知道读者里有没有寄生蜂大佬,可以帮忙看看我版纳的寄生蜂啊~~~~~
原文链接可读原英文文章