一、样本数据采集
从采集到的原始水样图像中进行选择性抽取和实时的抽取,形成建模数据和增量数据。
二、数据预处理
2.1 图像切割
用其他编程软件进行编程,切割水样图像中央101*101像素的图像。若原始图像大小为M*N,则截取宽从宽从(M/2-50)到(M/2+50),长度从 (M/2-50) 到 (M/2+50) 个像素点的子图像。
2.2 颜色矩特征提取
构造出特征:
- RGB各颜色的一阶颜色矩
- RGB各颜色的二阶颜色矩
- RGB各颜色的三阶颜色矩
三、构建专家样本
根据已完成预处理的建模数据,由有经验的专家对水样图像据经验进行分类,构建专家样本。
四、模型构建
4.1 建模
#-*- coding: utf-8 -*-
import pandas as pd
inputfile = '../data/moment.csv' #数据文件
outputfile1 = '../tmp/cm_train.xls' #训练样本混淆矩阵保存路径
outputfile2 = '../tmp/cm_test.xls' #测试样本混淆矩阵保存路径
data = pd.read_csv(inputfile, encoding = 'gbk') #读取数据,指定编码为gbk
data = data.as_matrix()
from numpy.random import shuffle #引入随机函数
shuffle(data) #随机打乱数据
data_train = data[:int(0.8*len(data)), :] #选取前80%为训练数据
data_test = d