1、 采集-采集节点管理-添加新节点

2、填写节点名称,选择编码(看看采集目标是用什么编码,查看源文件)

3、填写匹配网址和页码

4、填写要采集的内容标签

5、内容配置

6、文章的标题<title>匹配的字符串

7、文章具体内容标签和过滤规则

本文介绍了一种网页数据采集的方法,包括添加采集节点、配置节点信息等步骤。从设置节点名称到具体的内容标签匹配,为读者提供了详细的指南。
1、 采集-采集节点管理-添加新节点

2、填写节点名称,选择编码(看看采集目标是用什么编码,查看源文件)

3、填写匹配网址和页码

4、填写要采集的内容标签

5、内容配置

6、文章的标题<title>匹配的字符串

7、文章具体内容标签和过滤规则


被折叠的 条评论
为什么被折叠?