从零实现敏感词过滤：手把手教你用JavaScript保护表单内容」「程序开发必学！三步搞定敏感词检测（附完整代码+实战案例）」「拒绝违规内容！一个表单项目的敏感词过滤实战指南」「Web开发小

南北极之间

已于 2025-02-05 16:28:11 修改

阅读量773

点赞数 23

分类专栏：有用的知识文章标签：前端 javascript 人工智能关键词敏感词过滤审核

于 2025-02-05 16:27:20 首次发布

本文链接：https://blog.youkuaiyun.com/qq_22182989/article/details/145457371

版权

有用的知识专栏收录该内容

101 篇文章

订阅专栏

在这里插入图片描述

隐藏标题：🚀 程序开发敏感词过滤全攻略：代码实现与避坑指南

正文内容

1. 为什么需要敏感词过滤？

在用户输入场景（如评论、表单、聊天）中，敏感词过滤是合规性和用户体验的关键。它能：

避免违规内容传播
保护用户隐私
提升社区内容质量

2. 环境准备

开发工具：VS Code（或其他编辑器）
浏览器：Chrome
技术栈：HTML + JavaScript（无需后端）

3. 方法一：手写基础敏感词过滤

步骤1：定义敏感词库

// 敏感词列表（可根据需求扩展）
const sensitiveWords = ["暴力", "色情", "违禁品", "脏话"];

步骤2：编写过滤函数

function filterText(inputText) {
  let filteredText = inputText;
  sensitiveWords.forEach(word => {
    // 使用正则替换为*
    const regex = new RegExp(word, 'g');
    filteredText = filteredText.replace(regex, '***');
  });
  return filteredText;
}

步骤3：绑定表单事件

<input type="text" id="userInput" placeholder="请输入内容">
<button onclick="checkContent()">提交</button>

<script>
function checkContent() {
  const input = document.getElementById('userInput').value;
  const result = filterText(input);
  alert("过滤后内容：" + result);
}
</script>

4. 方法二：使用开源库`badwords`

步骤1：安装库

npm install badwords

步骤2：初始化过滤器

import Filter from 'badwords';

// 创建过滤器实例
const filter = new Filter();

// 添加自定义敏感词
filter.addWords("自定义敏感词1", "自定义敏感词2");

// 过滤文本
const cleanText = filter.clean("这是一句包含脏话的文本");
console.log(cleanText); // 输出：这是一句包含****的文本

5. 进阶优化

自定义敏感词库

将词库存储在JSON文件中，动态加载：

// words.json
{ "sensitiveWords": ["广告", "诈骗", "政治敏感"] }

// 加载词库
fetch('words.json')
  .then(response => response.json())
  .then(data => sensitiveWords.push(...data.sensitiveWords));

性能优化

使用Trie树算法提升匹配效率（示例代码片段）：

class TrieNode {
  constructor() {
    this.children = {};
    this.isEnd = false;
  }
}

// 构建Trie树代码略（可提供GitHub源码链接）

6. 完整代码示例

提供可运行的HTML文件（含表单提交、过滤、高亮敏感词功能）：

<!DOCTYPE html>
<html>
<body>
  <textarea id="input" rows="4"></textarea>
  <button onclick="filterContent()">检测</button>
  <div id="result"></div>

  <script>
    // 完整代码见：https://github.com/yourusername/sensitive-filter-demo
  </script>
</body>
</html>

7. 常见问题与解决方案

问题	解决方法
中英文混合词匹配失败	使用正则忽略大小写：`/word/gi`
过滤速度慢	改用Trie树或AC自动机算法
误判正常词汇	设置白名单机制
需要实时更新词库	定期从服务器加载最新词库