Sanitizer：给你的DOM消消毒

最新推荐文章于 2025-06-05 20:57:57 发布

转载最新推荐文章于 2025-06-05 20:57:57 发布 · 353 阅读

CC 4.0 BY-SA版权

原文链接：https://mp.weixin.qq.com/s?__biz=MzI4NDYxNTM0OQ==&mid=2247488662&idx=1&sn=cc227e981ce05499de75d6d4f8792c51&chksm=ebf9e34cdc8e6a5a7660238fcd30642326d93a6f65c9a6eb4e90a94477b8450dd7d32ffc193c&scene=126&&sessionid=0

文章标签：

#字符串 #js #javascript #vue #java

本文介绍了在处理可能含有风险的DOM时，如何利用浏览器的Sanitizer API来防止XSS攻击。Sanitizer API提供了转义和消毒两种方式，其中转义通过替换HTML特殊字符为实体来避免解析，而消毒则是直接过滤掉有害代码。文章详细讲解了Sanitizer API的使用方法，包括默认配置和自定义配置，并对比了与DOMPurify库的相似功能。最后讨论了Sanitizer API的兼容性和实际应用中选择转义或消毒的考量。

业务中经常遇到需要处理「有风险的DOM」的场景，比如：

各种工具的文本粘贴功能
需要渲染服务端返回HTML的场景

为了阻止潜在的XSS攻击，有两个选择：

escape（转义）
sanitize（消毒）

本文会介绍这两者的区别以及为DOM消毒的API —— Sanitizer。

本文内容来自Safe DOM manipulation with the Sanitizer API^[1]

转义与消毒

假设，我们想将这样一段HTML字符串插入DOM：

const str = "<img src='' onerror='alert(0)'>";

如果直接将其作为某个元素的innerHTML，img的onerror回调执行JS代码的能力会带来XSS风险。

一种常见解决方案是：转义字符串。

什么是escape

浏览器会将一些保留字符解析为HTML代码，比如：

<被解析为标签的开头
>被解析为标签的结尾
''被解析为属性值的开头和结尾

为了将这些保留字符显示为文本（不被解析为HTML代码），可以将其替换为对应的entity（HTML实体）：

<的实体为<
>的实体为>
''的实体为"

这种将HTML字符替换为entity的方式被称为escape（转义）

什么是sanitize

对于上面的HTML字符串：

const str = "<img src='' onerror='alert(0)'>";

除了转义''来规避XSS风险，还有一种更直观的思路：直接过滤掉onerror属性。

这种直接移除HTML字符串中有害的代码（比如<script>）的方式被称为sanitize（消毒）

需要用到一个API——Sanitizer^[2]。

首先我们通过Sanitizer构造实例：

const sanitizer = new Sanitizer();

调用实例的sanitizeFor方法，传入容器元素类型以及要消毒的HTML字符串：

sanitizer.sanitizeFor("div", str);

会得到一个HTMLDivElement（即我们传入的容器元素类型），其内部包含一个没有onerror属性的img：

默认情况下Sanitizer会移除所有可能导致JS执行的代码。

丰富的配置

Sanitizer不仅开箱即用，还提供丰富的白名单、黑名单配置：

const config = {
  allowElements: [],
  blockElements: [],
  dropElements: [],
  allowAttributes: {},
  dropAttributes: {},
  allowCustomElements: true,
  allowComments: true
};

new Sanitizer(config)

比如，allowElements定义元素白名单，只有名单内的元素会被保留，与之对应的blockElements是元素黑名单：

const str = `hello <b><i>world</i></b>`

new Sanitizer().sanitizeFor("div", str)
// <div>hello <b><i>world</i></b></div>

new Sanitizer({allowElements: [ "b" ]}).sanitizeFor("div", str)
// <div>hello <b>world</b></div>

new Sanitizer({blockElements: [ "b" ]}).sanitizeFor("div", str)
// <div>hello <i>world</i></div>

new Sanitizer({allowElements: []}).sanitizeFor("div", str)
// <div>hello world</div>

allowAttributes是属性白名单，与之对应的dropAttributes是属性黑名单，对于如下配置：

{
  allowAttributes: {"style": ["span"]},
  dropAttributes: {"id": ["*"]}}
}

代表消毒后的HTML：

只允许span元素拥有style属性
移除所有元素（*通配符代表所有元素）的id属性

兼容性

这么香的API兼容性怎么样呢：

当前只有在Chrome 93之后，开启试验标识后可使用：

about://flags/#enable-experimental-web-platform-features

虽然原生Sanitizer离稳定还遥遥无期，但你可以使用DOMPurify^[3]库实现类似功能。

后记

日常你更倾向使用escape还是sanitize呢？

参考资料

[1]

Safe DOM manipulation with the Sanitizer API: https://web.dev/sanitizer/

[2]

Sanitizer: https://wicg.github.io/sanitizer-api/

[3]

DOMPurify: https://github.com/cure53/DOMPurify