Selfoss项目中的源内容过滤机制详解-优快云博客

本文链接：https://blog.youkuaiyun.com/gitblog_01005/article/details/148864101

Selfoss项目中的源内容过滤机制详解

Selfoss作为一个开源的RSS阅读器和聚合工具，提供了强大的内容过滤功能。这项功能允许用户对订阅源中的条目进行筛选，只保留符合特定条件的内容。通过合理设置过滤规则，用户可以显著提升信息获取效率，避免无关内容的干扰。

Selfoss支持三种主要类型的过滤表达式，每种类型都有其特定的应用场景：

这是最简单的过滤形式，使用Perl兼容的正则表达式（PCRE）语法，格式为/正则表达式/。这种过滤会同时检查条目标题和内容。

示例：

/科技|技术/

这个表达式会保留所有标题或内容中包含"科技"或"技术"的条目。

当需要针对特定字段进行过滤时，可以使用字段限定符。语法格式为字段名:/正则表达式/。

支持过滤的字段包括：

示例：

title:/紧急通知/

这个表达式只会保留标题中包含"紧急通知"的条目。

通过在过滤表达式前添加感叹号(!)，可以实现反向选择，即排除符合条件的内容。

示例：

!/广告/

这个表达式会过滤掉所有包含"广告"字样的条目。

Selfoss使用PHP支持的正则表达式语法，以下是一些实用技巧：

过滤特定网站内容：
```
url:/^https:\/\/example\.com\/news\//
```
只保留example.com/news/下的内容
排除特定作者：
```
!author:/张三/
```
过滤掉作者为"张三"的所有条目
多条件组合：
```
title:/科技/ !content:/广告/
```
保留标题包含"科技"且内容不包含"广告"的条目