达观数据企业级搜索引擎,主要针对通信、能源、制造业等行业,解决企业内信息检索的问题。通过对散落在各系统中的数据、内容进行统一管理和高效利用,实现对企业内的数据、文档、人物、图片、表格等各形态信息进行全方位、高效率的统一检索。
达观数据企业级搜索引擎的核心功能包括:多源异构数据接入,数据解析,索引创建配置,搜索意图识别,搜索召回与排序等功能。
一、多源异构数据快速接入
要实现对企业内数据的统一搜索,首先需具备企业内多源异构数据的接入能力。达观企业级搜索引擎支持两种方式接入数据:数据上报和数据拉取。
图1 通过数据上报方式接入数据
图2 通过数据库连接的方式拉取数据
二、对接入的数据自动解析
数据解析包括各类文档解析器、PDF解析器、OCR引擎等对接入的数据如各类文档