利用云计算中的图像处理和神经网络识别地衣植物与蝴蝶
1 引言
为了快速识别地衣植物和蝴蝶,而不采用形态学、解剖学、生物化学和分子技术等传统方法,提出开发一种包含基于信息技术的图像处理技术的简单协议。将捕捉地衣和蝴蝶的图像,使用 SQL 和 ASP.NET 服务器将其存储在数据库中,然后使用 MATLAB® 进行图像预处理、分割、特征提取和外推。还将通过开发基于人工神经网络(ANN)的地衣和蝴蝶查找算法进行进一步识别。通过云计算方法,所开发的地衣和蝴蝶物种识别技术将向公众开放。
2 研究目标
- 收集印度各地地衣植物和蝴蝶的摄影图像,并运用图像处理技术按属和种对它们进行分类。
- 使用 SQL 和 ASP.NET 服务器将捕获的地衣和蝴蝶图像存储在数据库中。
- 使用 MATLAB® 对图像进行预处理、分割、特征提取和外推,然后运用地衣和蝴蝶查找算法以及人工神经网络。
- 若从西高止山脉收集的新地衣和蝴蝶物种无法被数据库分类,则采用手动和传统方法进行识别。
- 为便于比较,使用传统识别方法对收集的地衣和蝴蝶物种进行识别。
- 通过云计算方法使基于图像处理技术开发的地衣和蝴蝶物种识别技术可供公众轻松访问。
3 背景信息
3.1 地衣相关信息
地衣是真菌(菌共生体)和光合自养藻类(藻共生体)之间迷人的、自给自足的共生组合。全球约有 20,000 种地衣,印度有大约 2,300 种。印度的泰米尔纳德邦记录的地衣种类最多,有 785 个分类单元,其次是卡纳塔克邦(612 个分类单元)和安得拉邦(656 个分类单元)。地衣可生长在岩石、土壤和树皮上,约 557 种地衣被认为是印度特有的。地衣以其独特的次生代谢产物而闻名,共有约 1050 种化合物,其中 550 多种是地衣特有的。地衣化合物的衍生物包括脂肪酸、大环内酯、泽兰醇、普尔维酸衍生物等。从地衣体中提取的生物活性化合物具有多种生物活性,是有前景的抗生素替代抗菌剂,许多地衣物种具有药用价值,其化合物具有抗真菌、抗菌、抗病毒等广泛的生物作用。
3.2 蝴蝶相关信息
蝴蝶等昆虫在生态位的多样性和保护方面非常重要。在世界 17 个生物多样性大国中,印度拥有各种色彩斑斓的蝴蝶。印度约有 1400 种蝴蝶,其中许多是印度特有的。有必要在全球范围内设计和传播关于印度蝴蝶生物学和分布的完整信息,鼓励昆虫学家研究其自然历史、适应生态、种群多样性和分布数据。需要建立一个集中的数据库来记录印度各种蝴蝶的分布,以提高人们对其在生态位中保护的认识。蝴蝶是白天活动的飞行昆虫,与蛾类密切相关,是地球上最后出现的主要飞行昆虫类群。蝴蝶具有非凡的颜色和图案,其生活与开花植物密切相关,有助于被子植物的授粉。蝴蝶有四片长翅膀,覆盖着微小的鳞片,翅膀和鳞片的图案均匀且颜色鲜艳,雌雄蝴蝶在翅膀和鳞片图案上通常略有不同。
3.3 地衣和蝴蝶识别中的图像处理技术
印度是世界上的生物多样性中心之一,拥有多样的生态系统和丰富的动植物资源,其中许多微生物具有编码生物活性次生化合物的新基因。这些生物活性次生化合物具有各种生物活性,需要对新的植物和微生物的潜力进行重新评估和编目,以造福人类。然而,印度的生物系统学研究存在一些问题,如缺乏植物和动物分类学家及昆虫学家,植物和动物分类研究集中在少数机构,年轻研究学者缺乏未来就业机会和资金支持,学科间协调和合作研究不足,研究缺乏明确目标和规划,以及宏观和微生物研究缺乏优先方向等。因此,需要更加关注地衣和蝴蝶的生物多样性研究,而目前印度地衣和蝴蝶生物多样性研究的主要问题是品种识别。传统的地衣和蝴蝶识别方法存在困难,因此提出开发一种包含 IT 图像处理技术的简单协议来识别地衣和蝴蝶物种。通过图像处理技术,可以利用颜色、大小、形状和翅膀鳞片等数据快速准确地识别蝴蝶,减少识别所需的熟练劳动力和时间,并通过云计算技术使公众能够访问。
3.4 云计算中的图像处理技术
为了在有限的熟练人力和大量样本的情况下快速识别植物和昆虫样本,图像处理技术至关重要。数字图像识别通常用于分析数字图像内容,通过决策理论方法或句法方法将未知样本图像的抽象模式与已知模式进行匹配或分类。决策理论方法通过统计方法,利用有限的特征测量或特征进行图像分类;句法方法则使用树状模式,通过语法句法分析进行模式识别。计算机对输入数字图像的模式识别是一个自动化过程,可将数值输入转换为已知模式类及其特征,实现机器识别、描述和分类测试模式。自动化模式识别有许多优点,常用的方法包括统计方法、模板匹配、句法分析和人工神经网络。其中,人工神经网络在图像处理技术中得到广泛应用,特别是在生物技术和生物医学研究中作为分类工具,常用于 X 射线图像分割、图像分类等研究。传统的地衣分类和识别方法依赖人类专家,耗时且需要熟练人力,而近年来的图像处理和指纹技术依赖计算生物学专家和生物技术人员,可实现快速识别。使用图像处理技术的优势是能够快速准确地识别未知地衣样本,但需要高质量的图像、可变的特征、大小和形状以及高分辨率的数字图像。目前,全球趋势是利用信息技术验证地衣分类单元的身份,北美已经汇编了许多地衣专著和植物志,而南美和中美的相关研究则分散在文献中。
4 研究方法
4.1 数据收集
从印度南部西高止山脉不同农业气候条件的地区,如尼尔吉里斯、帕拉尼山、寂静谷国家公园、科代卡纳尔和奇卡马加尔等地,使用标准技术收集地衣物种及其数字图像,使用佳能数码相机获取图像,并参考 Awasthi 的地衣识别手册进行形态、解剖和生化研究。地衣和蝴蝶图像从正面、特写和全貌三个视角进行拍摄,并存储为数据集。
4.2 图像预处理
为了减少不必要的失真或提高图像质量以便进一步处理,对收集的图像进行预处理。预处理包括调整大小、转换(强度信息)和增强(使图像变亮或变暗)。本研究基于空域增强技术(如形态学操作、高斯滤波、非锐化掩蔽和自适应滤波方法)和频域增强技术(如小波变换技术)进行预处理,使用 MATLAB® R2010b 软件按照 Gomez 和 Gomez 的方法分析地衣和蝴蝶的数字数据。
4.3 图像分类
使用支持向量机(SVM)分类器对图像进行分类。从图像中提取对比度、相关性、能量、均匀性、均值、标准差、熵、均方根、方差、平滑度、峰度和偏度等特征作为输入,将输入样本图像的特征作为训练数据集。通过比较输入样本图像的特征与训练数据集,确定输入地衣和蝴蝶图像的物种名称。
4.4 数据库管理
使用结构化查询语言(SQL)管理关系数据库管理系统(RDBMS)中的图像,并创建地衣和蝴蝶图像数据库。使用活动服务器页面(ASP)开发和运行动态、交互式的地衣和蝴蝶图像数据库 Web 服务器应用程序。通过 SQL Server 2000 作为前端和 ASP.NET 作为后端创建计算工具,存储和存档地衣和蝴蝶图像。
4.5 图像分割
使用人工神经网络(ANN)根据地衣和蝴蝶数字图像的纹理和非纹理形状进行图像分割。通过训练地衣数据集并使用训练数据集测试未知地衣和蝴蝶图像进行识别。本研究共采集了 1500 张图像,使用地衣/蝴蝶查找算法将 130 x 130 像素的地衣和蝴蝶图像进行分割以便进一步扫描。在扫描过程中,从上到下、从左到右选择地衣和蝴蝶图像的形状作为输入在 ANN 中进行训练,随后提取子图像并与数据集中的理想形状进行比较。
4.6 特征提取
使用以下公式提取地衣的特征,如地衣生长形式(壳状、叶状和枝状)、颜色、大小、叶状体性质、叶状体上子实体的出现、地衣外层和假根的存在等。同样,使用该公式提取蝴蝶的类型、颜色、头部、腿部、腹部、翅膀和脉络图案、触角大小和排列以及胸部等特征:
[P(xi) = \frac{k}{N}]
其中,$P(xi)$ 定义为灰度级出现的概率,$k$ 是具有灰度对比度的像素数,$N$ 是各种图像中的总像素数。
以下是研究方法的流程图:
graph TD;
A[数据收集] --> B[图像预处理];
B --> C[图像分类];
C --> D[数据库管理];
D --> E[图像分割];
E --> F[特征提取];
研究中使用的主要工具和技术总结如下表:
| 工具/技术 | 用途 |
| ---- | ---- |
| MATLAB® R2010b | 图像分析和处理 |
| 支持向量机(SVM)分类器 | 图像分类 |
| 结构化查询语言(SQL) | 数据库管理 |
| 活动服务器页面(ASP) | 开发 Web 服务器应用程序 |
| 人工神经网络(ANN) | 图像分割和识别 |
5 研究观察
5.1 地衣图像预处理
地衣图像预处理是后续分析的基础。在这一阶段,主要对采集到的地衣图像进行了多方面的处理。首先是调整大小,将不同尺寸的地衣图像统一到合适的规格,便于后续的特征提取和分析。接着进行强度信息的转换,使图像的灰度值分布更加合理,突出地衣的关键特征。同时,通过增强操作,如使图像变亮或变暗,进一步提升地衣特征的清晰度。具体采用了空域增强技术和频域增强技术。空域增强技术包括形态学操作、高斯滤波、非锐化掩蔽和自适应滤波方法,这些方法能够去除图像中的噪声,平滑图像边缘,增强地衣的纹理特征。频域增强技术则运用小波变换技术,从频域角度对图像进行处理,突出地衣的高频特征,使地衣的细节更加明显。
5.2 预处理后的地衣和蝴蝶图像分割
对预处理后的地衣和蝴蝶图像进行分割是识别过程中的关键步骤。使用人工神经网络(ANN)根据地衣和蝴蝶数字图像的纹理和非纹理形状进行分割。通过训练地衣数据集,让 ANN 学习地衣和蝴蝶的特征模式。在测试未知地衣和蝴蝶图像时,将其与训练数据集进行对比,从而实现准确的分割。具体操作中,从 1500 张图像中选取 130 x 130 像素的地衣和蝴蝶图像,使用地衣/蝴蝶查找算法进行分割。在扫描过程中,按照从上到下、从左到右的顺序,选择合适的形状作为输入在 ANN 中进行训练,随后提取子图像并与数据集中的理想形状进行比较,确保分割的准确性。
5.3 地衣和蝴蝶物种的分类与预测
采用支持向量机(SVM)分类器对图像进行分类和预测。从图像中提取对比度、相关性、能量、均匀性、均值、标准差、熵、均方根、方差、平滑度、峰度和偏度等特征作为输入。这些特征能够全面反映地衣和蝴蝶的外观特点。将输入样本图像的特征作为训练数据集,在 SVM 分类器中与已知的训练数据进行比较,从而确定输入地衣和蝴蝶图像的物种名称。通过这种方式,可以实现对地衣和蝴蝶物种的准确分类和预测。
5.4 地衣和蝴蝶图像的识别
结合图像预处理、分割和分类的结果,实现地衣和蝴蝶图像的识别。首先,经过预处理和分割后的图像,其特征更加清晰和明确。然后,通过 SVM 分类器进行分类和预测,得到初步的识别结果。最后,将识别结果与数据集中的理想样本进行对比,进一步验证识别的准确性。在识别过程中,充分利用云计算技术,将大量的图像数据存储在云端,方便随时调用和分析,提高识别的效率和准确性。
5.5 人工神经网络(ANN)的实施
ANN 在整个研究中起到了重要的作用。在图像分割阶段,通过训练地衣数据集,让 ANN 学习地衣和蝴蝶的特征模式。在测试未知地衣和蝴蝶图像时,将其与训练数据集进行对比,实现准确的分割。在识别过程中,ANN 也作为分类工具,对图像进行分类和预测。具体实施时,选择合适的神经网络结构和参数,如输入层、隐藏层和输出层的节点数,学习率等。通过不断的训练和优化,提高 ANN 的性能,使其能够更准确地识别地衣和蝴蝶图像。
5.6 从输入图像中提取地衣和蝴蝶的灰度子图像
从输入图像中提取地衣和蝴蝶的灰度子图像,有助于进一步分析和识别。在图像预处理和分割的基础上,通过特定的算法,将地衣和蝴蝶的区域从原始图像中提取出来,并转换为灰度图像。灰度图像能够突出地衣和蝴蝶的纹理和形状特征,减少颜色信息的干扰。提取的灰度子图像可以作为后续分析的基础,如特征提取、分类和识别等。
5.7 云计算技术的应用
云计算技术在本研究中具有重要的应用价值。通过云计算平台,可以存储大量的地衣和蝴蝶图像数据,方便随时调用和分析。同时,云计算平台提供了强大的计算能力,能够快速处理和分析图像数据,提高识别的效率。在研究过程中,将图像数据上传到云端,利用云计算平台的资源进行图像预处理、分割、分类和识别等操作。云计算技术还支持多用户同时访问和使用,使研究成果能够更广泛地应用于实际场景。
以下是研究观察阶段的操作步骤列表:
1. 地衣图像预处理:调整大小、强度转换、增强操作,采用空域和频域增强技术。
2. 图像分割:使用 ANN,从 1500 张图像中选取 130 x 130 像素图像进行分割,提取子图像并对比。
3. 分类与预测:用 SVM 分类器,提取特征作为输入,与训练数据集比较。
4. 图像识别:结合预处理、分割和分类结果,与理想样本对比。
5. ANN 实施:选择合适结构和参数,训练和优化。
6. 灰度子图像提取:从输入图像中提取并转换为灰度图像。
7. 云计算应用:上传数据到云端,利用资源进行处理和分析。
6 研究结论
本研究提出了一种利用云计算中的图像处理和神经网络识别地衣植物与蝴蝶的方法。通过收集印度各地地衣和蝴蝶的图像,运用图像处理技术进行预处理、分割、分类和识别,结合人工神经网络和云计算技术,实现了地衣和蝴蝶物种的快速准确识别。该方法能够减少传统识别方法所需的熟练劳动力和时间,提高识别的效率和准确性。同时,通过云计算技术,将研究成果公开,方便公众使用。研究结果表明,图像处理技术和神经网络在生物物种识别领域具有广阔的应用前景,为生物多样性研究和保护提供了有力的支持。未来,可以进一步优化算法和模型,提高识别的精度和稳定性,扩大研究范围,将该方法应用于更多的生物物种识别中。
以下是研究过程的总结表格:
| 阶段 | 主要操作 | 工具/技术 |
| ---- | ---- | ---- |
| 数据收集 | 从西高止山脉采集地衣和蝴蝶图像 | 佳能数码相机,Awasthi 识别手册 |
| 图像预处理 | 调整大小、转换、增强,采用空域和频域增强技术 | MATLAB® R2010b |
| 图像分类 | 用 SVM 分类器提取特征分类 | 支持向量机(SVM)分类器 |
| 数据库管理 | 使用 SQL 和 ASP 管理和开发数据库 | 结构化查询语言(SQL),活动服务器页面(ASP) |
| 图像分割 | 用 ANN 根据地衣和蝴蝶形状分割 | 人工神经网络(ANN) |
| 特征提取 | 使用公式提取地衣和蝴蝶特征 | - |
| 研究观察 | 包括预处理、分割、分类、识别等多方面观察 | 多种工具和技术结合 |
| 研究结论 | 总结方法优势和应用前景 | - |
超级会员免费看
43

被折叠的 条评论
为什么被折叠?



