智能互联网信息系统:知识获取与应用
在当今数字化时代,互联网蕴含着海量的信息,但如何高效地获取和利用这些信息成为了一个关键问题。本文将介绍一种智能互联网信息系统,它旨在自动从网络中获取有用的信息和知识,为用户提供便利。
1. 系统基础组件与流程
首先,候选模式会被发送到 BLAST 服务器,用于匹配相似模板并检索相应的元数据。在初始阶段,由于模板数据库为空,没有匹配的模板。用户可以在分数评估器和用户标签界面中,将这些候选模式标记为带有元数据的模板,或者跳过其中一些候选模式。
目前,该系统中的 13ME 仍处于开发阶段。许多信息提取(IE)系统已成功应用于特定领域,而这里提出的 13ME 旨在构建一个不太依赖领域知识的通用 IE 系统。
2. 知识学习模块
2.1 13 知识学习器(13KL)概述
将网页文档组织成层次结构的目录是管理信息的常见方法,这种层次目录的概念广泛应用于电话簿、地址簿、图书馆和文件系统中,是人类组织信息作为知识的最自然方式。因此,本体(或概念层次结构)是内在的领域知识。13KL 是一个用于文档分类的监督学习系统,它从初始的领域本体中获取分类知识,该本体包含人类手动构建的层次目录和文档。它是之前工作 ACIRD 的扩展。
2.2 ACIRD 系统
ACIRD 即互联网资源发现自动分类器,是一个智能信息系统,用于自动收集和分类网页文档,以实现高效的管理和检索。其主要流程如下:
1. 数据准备 :领域专家提供一个类格(目录),并将一组训练数据(文档)分配到一个或多个类中。
2.
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



