算法捉虫:深度学习和计算机视觉改变昆虫学
导语
计算机算法不仅可以帮助我们检查软件程序中的bug,也能助力科学家去寻找自然界中的真·bug。今年发表于 PNAS 的一篇论文,提出了基于传感器的大规模昆虫检测,利用深度学习技术,获得全面的生态信息大数据。
生物种群进入高速灭迹新时期
世界走到了某个紧要的关头:许许多多的征兆似乎在预示着世界末日的来临。以生物学为例,人类现在所经历的第六次生物大灭绝,可能等同于6500万年前的白垩纪生物灭绝事件。在那次事件中,恐龙——地球上曾经的主宰——沉入地下,成为了岩层中的化石。无论是科学家还是博物爱好者都能轻而易举查阅到大量的鸟类、哺乳类和两栖动物的灭绝记录,在那一时期,地球上大约有80%的物种消失了。
现在,有众多研究报告表明,昆虫在消失。三年前,德国克雷菲尔德昆虫学会发布的报告总结并指出,30 年来,飞行类昆虫的数量减少了75%。随后,一项发表于 Nature [1]上关于昆虫总生物量和种群数量的测量研究也证实了这一点。
昆虫在世界中发挥了重要作用
然而,相较于其他表明昆虫种群数量依旧稳定的研究,这样的结论也许确实耸人。研究人员一直在思考,是否学界夸大了昆虫灭绝的影响。考虑到昆虫对我们人类生存环境的重要影响,在作出相应的结论前,研究人员应当拥有准确详细的数据。昆虫类似能自动加油的微型汽车。昆虫的身体结构比人类发明出的任何设施都要先进。昆虫可以执行不计其数的任务,从瓜果蔬菜到野草花粉、从枯枝烂叶到粪便腐肉,昆虫的身影可以说无处不在,它们净化了土壤与水体,并促进了在营养物质在自然界中的循环。
蜜蜂提供授粉(图源pixabay)
所以说,昆虫为生态系统中其他不计其数的物种提供了食物来源,昆虫数量减少所造成的影响可能是无法想象的。虽然现代科技发展迅猛,而且研究人员对昆虫的探索手段并没有显著提高。科研人员仍然采用缓慢低效的劳动力密集型手段来对昆虫进行跟踪。如果他们能借助新的科技去完成这项古老的工作,获得昆虫更详细的信息,相应问题也就更容易解决。
人工智能带来希望
不过,近十年来,深度学习等技术的发展为昆虫学这一古老的学科带来了新的机遇。基于深度学习算法的图像处理技术和计算机视觉技术正在替代传统的人工观测方法。
在农业中,昆虫通常被视为害虫,因此已有的昆虫检测技术往往是通过检测昆虫的行为,开发更加高效的杀虫剂从而防治虫害。不过,科研人员可以基于同样的技术原理改变其用途。近期的研究就表明,利用摄像机、雷达与麦克风等传感设备可以获得的数据集规模比传统的观测手段要高出多个数量级。因此深度学习算法就成为了一个提取处理数据的重要工具。
这一方法已经在单一物种的检测中得到了应用。例如,科研人员可以把一种以橄榄树为食的昆虫引诱至陷阱中,然后自动拍照并利用远程服务器中的算法进行分析。相应的识别算法在人脸识别问题中已经超越了人类的能力,在昆虫领域自然也不例外。深度神经网络已经可以识别并统计昆虫的数量,此外也能获得更加丰富的内容,如蜜蜂和其他访花昆虫的季节性动态信息。
Høye 和他的同事们[2]就专注于几项潜在的革命性研究应用。首先,为了更好地了解全球昆虫减少的严重程度,世界各国的研究机构都可以开始采用基于图像识别技术进行昆虫丰度和多样性监测。类似乎拍照识花之类的手机应用,人们也可以采用同样的思路去识别单只昆虫[3,4]。虽然这种方法并不太适用于严肃系统化的生态检测与科研任务,但也是一个值得期待的方向。能生成高时空分辨率图像的延时相机也在研发当中,这类技术可以应用于对田野、森林等区域中特定昆虫物种的检测。
深度学习进一步助力昆虫研究
这些新技术也为了解物种之间的相互作用带来了契机。物种之间的相互作用对于整个生态系统而言至关重要。但因其出现的时间不确定且概率较低,因此难以人工检测并进行记录。然而,高速图像检测技术就可以解决这一问题。诸如,昆虫造访花朵与动物采食青草、落叶植物等过程都可以通过固定的摄像机机位对生物的完整生长过程进行记录。延时相机和深度学习技术在记录植物-昆虫相互作用方面的能力也已经被得到了验证。
物种间具有复杂互作关系 Nature (S. Seibold et al. Nature 574, 671–674; 2019)
一个更为宏大的目标就是利用机器学习图像识别分类的技术来推动分类学自身的发展。在近期的一项研究中,通过对约65000张博物馆标本甲虫图像的数据进行学习,识别系统达到了75%的成功率。虽然,识别系统的成功率会改进提升,但分类学家也不必担心“人工智能抢饭碗”等失业问题。新的技术可以应用于常规的识别鉴定工作,以减轻科研工作者的工作负担,让专业人士的精力能更多的分配到标本研究的工作中。
Mark Buchanan | 作者
Leo | 译者
赵雨亭 | 审校
邓一雪 | 编辑
商务合作及投稿转载|swarma@swarma.org◆ ◆ ◆