SiteFactory 版本如何进行文章采集

本文详细介绍了如何在后台管理系统中设置C#板块的内容采集流程,包括添加采集项目、设置编码方式、列表页与内容页的采集规则,以及开始采集项目的具体步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.登陆后台 点击 ”内容管理” 在选择 “采集管理”。

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

2.在“采集管理向导”中选择 “添加采集项目”。

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

3.采集项目设置 这里我们以采集www.54it.com.cn亿讯网络学院中的c#板块为例子

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

注:编码选择 为我们提供了三种编码方式(指的是将要采集的网站的编码)。怎么样才能知道将要采集网站的编码方式呢?答案是查看对方的源代码。

亿讯网络 >> 学院 >> 程序开发 >> C#语言

上面的代码一看就明白对方采用的是GB2312那么我在这里也选择GB2312。

4.列表页采集设置

4.1获取列表页

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

点击“测试列表”按钮 左边的源码文本框中按照规则截取相应的源代码。

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

4.2获取连接

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

点击“测试连接”按钮 左边的源码文本框中按照规则截取相应的源代码

4.3分页设置

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

5.内容页采集设置 我在这里只举例设置文章标题跟文章内容其他选项大家可以根据自己的需要自行设置。

5.1 获取文章的标题

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

在列表中选择 “标题”列 使用采集规则 点击“设置采集规则”按钮设置好字段开始结束代码后 点击 测试字段 左边的源代码文本框中 显示结果 标题设置完毕。

5.2获取文章内容设置

在列表中选择 “文章内容”列 使用采集规则 点击“设置采集规则”按钮

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

设置好字段开始结束代码,大家可以根据自己网站的需要选择过滤参数。点击 测试字段 左边的源代码文本框中 显示结果 文章内容设置完毕。

注:在匹配获取文章内容时可以通过选择左方下拉列表中的网页列表来分析文章内容选择合适的字段开始结束标记。以求达到完美。

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

6.项目采集

在采集管理向导中 选择“开始采集” 选中要采集的项目 点击“开始采集”按钮 采集系统就开始运行了。

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

图片点击可在新窗口打开查看此主题相关图片如下:
图片点击可在新窗口打开查看

内容概要:本文档为《400_IB Specification Vol 2-Release-2.0-Final-2025-07-31.pdf》,主要描述了InfiniBand架构2.0版本的物理层规范。文档详细规定了链路初始化、配置与训练流程,包括但不限于传输序列(TS1、TS2、TS3)、链路去偏斜、波特率、前向纠错(FEC)支持、链路速度协商及扩展速度选项等。此外,还介绍了链路状态机的不同状态(如禁用、轮询、配置等),以及各状态下应遵循的规则和命令。针对不同数据速率(从SDR到XDR)的链路格式化规则也有详细说明,确保数据包格式和控制符号在多条物理通道上的一致性和正确性。文档还涵盖了链路性能监控和错误检测机制。 适用人群:适用于从事网络硬件设计、开发及维护的技术人员,尤其是那些需要深入了解InfiniBand物理层细节的专业人士。 使用场景及目标:① 设计和实现支持多种数据速率和编码方式的InfiniBand设备;② 开发链路初始化和训练算法,确保链路两端设备能够正确配置并优化通信质量;③ 实现链路性能监控和错误检测,提高系统的可靠性和稳定性。 其他说明:本文档属于InfiniBand贸协会所有,为专有信息,仅供内部参考和技术交流使用。文档内容详尽,对于理解和实施InfiniBand接口具有重要指导意义。读者应结合相关背景资料进行学习,以确保正确理解和应用规范中的各项技术要求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值