多维夜视信息理解与挖掘:技术、挑战与展望
1. 信息挖掘基础
信息挖掘,尤其是数据挖掘,是从海量、不完整、有噪声、模糊且随机的数据中提取隐含的、未知但潜在有用的信息和知识的过程。它与数据库知识、数据分析、数据融合和决策支持等概念密切相关。初始数据就像蕴含矿物的矿石,是知识的来源。这些数据可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本、图形和图像数据;甚至可以是异构的,分布在网络中。发现知识的方法既可以是数学的,也可以是非数学的;既可以是演绎的,也可以是归纳的。挖掘出的知识可用于信息管理、查询优化、决策支持、过程控制等,还可用于数据本身的维护。数据挖掘是一种广义的跨学科技术,将从事数据库、人工智能、数理统计、可视化、并行计算等不同领域的研究人员聚集在一起。
与传统数据分析(如查询、报告和在线应用分析)不同,数据挖掘无需明确假设就能“挖掘”信息和发现知识。通过数据挖掘获得的信息应具备三个特点:先前未知、有效和实用。先前未知的信息不言而喻,数据挖掘包括发现那些仅凭直觉无法找到的信息或知识,挖掘出的信息越出乎意料,其价值就越高。例如,在商业应用中,一家连锁商店利用数据挖掘揭示了儿童尿布和啤酒之间令人惊讶的联系。
2. 图像挖掘技术
图像挖掘(IM)基于数据挖掘理论,从海量图像中提取信息,包括隐藏的有用规律、关系、模式、规则和兴趣趋势。IM利用语义进行智能图像处理,提取信息、知识和模式。常用的IM方法包括关联规则分析、图像聚类、图像分类等,相关技术包括人工神经网络、遗传算法、决策树、规则归纳等。
原始图像不能直接用于挖掘,必须进行预处理以生成图像特征数据库,供高级挖掘模块使用。一个IM系统应具备图像存储、预处理、索引、检索、挖掘
超级会员免费看
订阅专栏 解锁全文
840

被折叠的 条评论
为什么被折叠?



