| WEB网页结构化信息抽取技术介绍 |
| 关键词:结构化信息抽取,信息抽取 |
|
WEB结构化信息抽取就是将网页中的非结构化数据按照一定的需求抽取成结构化数据。是垂直搜索引擎和通用搜索引擎最大的差别。 模板方式是事先对特定的网页进行配置模板,抽取模板中设置好的需要的信息,可以针对有限个网站的信息进行精确的采集。 网页库结构化信息抽取是采用页面结构分析与智能节点分析转换的方法,自动抽取结构化的数据。
|
介绍WEB网页结构化信息抽取技术,包括两种主要方法:模板方式和网页库级结构化信息抽取。前者适用于少量信息源的精确采集,后者适用于任意正常网页的自动化抽取。
| WEB网页结构化信息抽取技术介绍 |
| 关键词:结构化信息抽取,信息抽取 |
|
WEB结构化信息抽取就是将网页中的非结构化数据按照一定的需求抽取成结构化数据。是垂直搜索引擎和通用搜索引擎最大的差别。 模板方式是事先对特定的网页进行配置模板,抽取模板中设置好的需要的信息,可以针对有限个网站的信息进行精确的采集。 网页库结构化信息抽取是采用页面结构分析与智能节点分析转换的方法,自动抽取结构化的数据。
|

被折叠的 条评论
为什么被折叠?