数据采集环境与方法
构建农业病虫害数据集所面临的问题与其特殊环境和采集方式相关。下面分别从数据采集环境和数据采集方式两个方面来分析构建数据集所面临的问题。在农业病虫害识别应用中,害虫图像的采集是十分重要的环节之一,同时也是非常耗时的环节。在不同环境下利用不同的数据采集方法,所构建的数据集也具有其独到的特点。1
数据采集环境
当前大多数据集是在相对理想环境的实验室中利用专业设备采集到的图像数据,这种方式能够快速获得想要的特定样本图像,种类往往不具有足够的代表性。在实际农业生产中,不同地区、不同作物的病虫害图像数据采集是非常困难的。第一,随着农药的普及和及时使用,大田作物中的一些病虫害更难以进行全周期采集,想要采集到完整的图像数据越发困难。第二,在自然环境中的农业病虫害,发生规律差异很大,时间横跨一年四季、地理位置遍布祖国大江南北,甚至同种病虫害不同发展阶段的形态也差异明显,准确地鉴别并对其采集也是一项严峻的挑战;第三,农业病虫害由于个体小、隐蔽性强,田间实地难以发现,因此发现并采集到清晰的图像样本也是十分困难的。表1对比了农业病虫害图像不同采集环境的特点。
表1 病虫害图像的不同采集环境对比Table 1 Comparison of different collection environments for disease and pest images周围环境对农业病虫害图像采集有着较大的影响,大田自然环境中,寄主、季节、温湿度、光线等环境因素的多变导致了农业病虫害所呈现出的性状具有多样性。图1展示了部分害虫在不同环境中呈现的外观多样性。图1(a)为大田自然环境中同一种害虫,受到寄主、温湿度、光线角度等因素影响,表现出的背部不同颜色特征。图1(b)为同一种害虫在不同光源条件下的外观特征,在自然环境中光线较弱或者受到遮挡时,图像整体偏暗,会出现目标的部分特征消失现象,在人工补光适当的条件下,图像中的目标和背景表现出的特征较为明显,当人工补光过度时,光线整体较亮,会出现部分背景的特征消失现象。图1(c)展示的是受到不同季节、不同寄主等因素的影响,同一害虫表现出的不同颜色对比。通常而言,在多样的环境和不同光线下的复杂场景中采集到的病虫害图像有利于丰富数据集的多样性,更有利于提高模型的鲁棒性。因此应当根据实际任务需求,灵活地调节环境变量因素,构建数据集。
图1 不同环境下拍摄的害虫图像Fig. 1 Images of pests taken in different environments2
数据采集方法及设备
目前越来越多的团队根据自己的需求,使用不同的设备来采集特定种类的农业病虫害数据。早在1998年,Zayas和Flinn就通过照相机等设备在室内实验室环境中搭建了图像采集设施,利用不同角度的灯光照射,解决了拍摄图像中存在阴影的问题。韩瑞珍开发了一种害虫样本图像采集系统,该系统利用工业相机,将害虫样本置于置物台上,分别进行正视和俯视两种角度的拍摄。刘媛媛为了拍摄清楚害虫的细节特征,使用了显微镜采集稻纵卷叶螟、小菜蛾等图像数据。Wu等使用无人机搭载摄像头对健康和患病的玉米数据图像进行采集。周瑶在大田环境安装害虫引诱设备来捕获害虫,通过在引诱设备对面安装摄像机来采集害虫图像。白静亚开发了一款带有自动采集害虫图像的诱虫灯设备,利用害虫屈光原理,引诱害虫撞击昏迷,在害虫以自由落体的过程中对其进行拍摄。随着手机摄影技术的发展,智能手机的拍照摄像功能也越来越强大,使用手机采集农作物病虫害图像数据更加便捷,Li等通过智能手机和索尼单反相机采集了像素大小为4928×3264的水稻鞘叶枯病图像1800张、水稻褐斑病图像1760张,以及像素大小为2592×1944的水稻干螟虫症状图像1760张。近年来,许多团队也开始尝试将病虫害图像数据和其周围环境数据进行融合,如地理信息、气象信息、作物信息等,形成多模态农业病虫害数据集,用以挖掘更具有价值的信息。史东旭等使用最新的通信技术,通过无人机搭载摄像头和传感器来采集图像信息和周围环境信息,利用大数据平台建立农业病虫害发生模型,从周围环境信息来分析农业病虫害的发生原因。为了进一步分析不同数据采集方式带来的影响,表2整理了不同设备采集农业病虫害图像数据方式的优缺点。
表2 图像的不同采集方式对比Table 2 Comparison of different image acquisition methods 目前,农业病虫害图像数据采集设备可分为3大类:手持设备、无人机平台和固定采集装置。手持设备具备方便灵活等优势,将网络设备、单反相机和拍摄杆等设备组合到一起能够取长补短,拍摄到更多种类的病虫害图像,这类设备便于在自然环境复杂的地方拍摄,但是往往需要具有植保知识的专业人员去大田环境或者实验室里找到病虫害的发生位置,在拍摄过程中还需要具备一定的摄影知识,拍摄效率低;固定采集装置可安装在室外大田环境或者室内实验室中,一旦固定装置建造好,往往只能拍摄固定区域内的固定种类的害虫图像,造价成本比较昂贵,但是固定装置可搭载高精度的监测设备全天候不间断自动拍摄,并且将获取到的图像数据及时上传至云平台进行处理,拍摄效率较高;无人机平台可以灵活搭载各种光学传感设备,例如高清摄像头、高光谱镜头和远红外镜头等,其更适用于在大型农场或者大规模连片大田进行图像数据采集,但是其拍摄的细节特征不够明显,多用来进行农业病害图像采集,少有学者用它来采集农业害虫图像。在不同的环境中,灵活应用不同的设备可以提高图像采集效率,但是不同的设备所采集到的图像也具有不同的特点。智能手机受到硬件的限制,拍摄出的照片清晰度往往不高,单反相机属于专业拍照设备,微距镜头的使用容易导致拍摄出的照片出现模糊或者光线较弱的现象,大田自动采集设备需要事先设定好的拍照程序,在一定时间内易出现遮挡、密集等问题,显微镜可以拍摄尺寸更小的目标,受到其视野的限制,照片中的背景信息较为缺乏。一套便携、优价、自动化程度高、适用场景广、能够采集多源数据的农业信息化采集设备可以帮助农业科技人员提高数据采集效率,应当加强农业设备和农业信息化的融合,为农业病虫害识别提供强大的基础采集设备,为病虫害监测预警提供有力的数据支撑。