uBlockOrigin-HUGE-AI-Blocklist高级功能:如何结合正则表达式实现精准关键词拦截

uBlockOrigin-HUGE-AI-Blocklist高级功能:如何结合正则表达式实现精准关键词拦截

【免费下载链接】uBlockOrigin-HUGE-AI-Blocklist 【免费下载链接】uBlockOrigin-HUGE-AI-Blocklist 项目地址: https://gitcode.com/GitHub_Trending/ub/uBlockOrigin-HUGE-AI-Blocklist

你是否在搜索引擎中频繁遇到AI生成内容?想要精准拦截特定关键词却不知从何下手?本文将详细介绍如何利用uBlockOrigin-HUGE-AI-Blocklist项目的高级功能,结合正则表达式实现对AI生成内容的精准拦截,让你的搜索结果更加纯净。

项目简介

uBlockOrigin-HUGE-AI-Blocklist是一个手动整理的大型AI生成内容网站拦截列表,包含1000多个网站,旨在通过uBlock Origin或uBlacklist清理图片搜索引擎(Google Search、DuckDuckGo和Bing)中的AI生成内容。该项目还支持移动设备(iOS、iPadOS、Android)以及pihole/adguard(通过Hosts文件)。

官方文档:README.md

主要拦截列表:list.txt

uBlacklist专用列表:list_uBlacklist.txt

正则表达式基础

正则表达式(Regular Expression,简称Regex)是一种用于匹配文本模式的工具。在拦截AI生成内容时,正则表达式可以帮助我们精准匹配包含特定关键词的内容。

常用正则表达式语法

语法说明示例
*匹配前面的字符零次或多次ai* 匹配 "a"、"ai"、"aii" 等
+匹配前面的字符一次或多次ai+ 匹配 "ai"、"aii" 等,但不匹配 "a"
?匹配前面的字符零次或一次ai? 匹配 "a" 或 "ai"
.匹配任意单个字符a.i 匹配 "aai"、"abi"、"aci" 等
[]匹配括号内的任意一个字符[Aa]i 匹配 "Ai" 或 "ai"
()分组(ai\|AI) 匹配 "ai" 或 "AI"
\|ai\|AI 匹配 "ai" 或 "AI"
^匹配字符串的开始^ai 匹配以 "ai" 开头的字符串
$匹配字符串的结束ai$ 匹配以 "ai" 结尾的字符串
\s匹配空白字符ai\s 匹配 "ai "
\w匹配字母、数字或下划线ai\w 匹配 "ai1"、"ai_" 等

uBlock Origin中的正则表达式应用

在uBlock Origin中,我们可以通过自定义过滤器来实现基于正则表达式的关键词拦截。

基本语法

uBlock Origin的过滤器语法支持使用正则表达式,格式如下:

google.com,duckduckgo.com,bing.com##div>a:has-text(/正则表达式/i):upward(div):style(opacity:0!important)

其中,/正则表达式/i中的i表示不区分大小写。

示例:拦截包含"AI生成"的内容

google.com,duckduckgo.com,bing.com##div>a:has-text(/ai\s*生成/i):upward(div):style(opacity:0!important)

这个过滤器会在Google、DuckDuckGo和Bing搜索引擎中,拦截所有包含"AI生成"、"ai生成"、"AI 生成"等变体的搜索结果。

预设关键词过滤器

项目提供了一些预设的关键词过滤器,你可以在README.md的"Extended Filtering"部分找到它们。例如:

google.com,duckduckgo.com,bing.com##div>a:has-text(/Stable Diffusion/i):upward(div):style(opacity:0!important)
google.com,duckduckgo.com,bing.com##div>a:has-text(/AI Art/i):upward(div):style(opacity:0!important)
google.com,duckduckgo.com,bing.com##div>a:has-text(/Generative AI/i):upward(div):style(opacity:0!important)

uBlacklist中的正则表达式应用

uBlacklist同样支持使用正则表达式来过滤搜索结果,其语法与uBlock Origin略有不同。

基本语法

在uBlacklist中,使用正则表达式的格式如下:

/regex/

示例:拦截包含AI生成关键词的网站

/(generative)? *AI *(art|generated|illustration)?/i

这个正则表达式会匹配包含"AI art"、"Generative AI"、"AI generated"等关键词的网站。

预设正则表达式

项目提供的预设uBlacklist正则表达式可以在README.md中找到,例如:

/(ada)?Lo(RA|Con) *(model)?|(stable)?.*diffusion|midjourney|niji|sd *(xl|1.5)|(text|txt|img|image) *(to|2) *(image|img|video)/i

高级技巧:组合多个关键词

有时我们需要同时拦截多个关键词,这时可以使用正则表达式的|操作符来组合多个模式。

示例:同时拦截"AI"和"机器学习"

在uBlock Origin中:

google.com,duckduckgo.com,bing.com##div>a:has-text(/(ai|机器学习)/i):upward(div):style(opacity:0!important)

在uBlacklist中:

/(ai|机器学习)/i

示例:拦截特定模式的URL

如果你想拦截所有包含"ai-generator"的URL,可以使用以下过滤器:

在uBlock Origin中:

*##a[href*="ai-generator"]:upward(li):remove()

在uBlacklist中:

*://*/*ai-generator*

如何添加自定义过滤器

在uBlock Origin中添加

  1. 点击uBlock Origin图标,打开仪表板。
  2. 切换到"我的过滤器"选项卡。
  3. 粘贴你的自定义过滤器。
  4. 点击"应用更改"按钮。

在uBlacklist中添加

  1. 打开uBlacklist的选项页面。
  2. 在文本框中输入你的自定义过滤器。
  3. 点击"保存"按钮。

注意事项

  1. 性能影响:过于复杂的正则表达式可能会影响浏览器性能,建议保持正则表达式简洁高效。
  2. 误拦截:正则表达式可能会误拦截一些非AI生成的内容,你可以通过README.md中介绍的"Allowlisting sites"方法来允许特定网站。
  3. 定期更新:AI生成内容的网站和关键词不断变化,建议定期更新拦截列表。项目的主要拦截列表是list.txt,uBlacklist专用列表是list_uBlacklist.txt

总结

通过结合uBlockOrigin-HUGE-AI-Blocklist和正则表达式,我们可以实现对AI生成内容的精准拦截。无论是简单的关键词匹配还是复杂的模式识别,正则表达式都能为我们提供强大的过滤能力。希望本文介绍的方法能帮助你打造更纯净的搜索体验。

如果你有新的关键词或网站需要拦截,可以通过项目的贡献指南README.md来提交PR或issue,共同完善这个拦截列表。

【免费下载链接】uBlockOrigin-HUGE-AI-Blocklist 【免费下载链接】uBlockOrigin-HUGE-AI-Blocklist 项目地址: https://gitcode.com/GitHub_Trending/ub/uBlockOrigin-HUGE-AI-Blocklist

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值