业务中经常遇到需要处理「有风险的DOM」的场景,比如:
各种工具的文本粘贴功能
需要渲染服务端返回
HTML的场景
为了阻止潜在的XSS攻击,有两个选择:
escape(转义)sanitize(消毒)
本文会介绍这两者的区别以及为DOM消毒的API —— Sanitizer。

本文内容来自Safe DOM manipulation with the Sanitizer API[1]
转义与消毒
假设,我们想将这样一段HTML字符串插入DOM:
const str = "<img src='' onerror='alert(0)'>";如果直接将其作为某个元素的innerHTML,img的onerror回调执行JS代码的能力会带来XSS风险。
一种常见解决方案是:转义字符串。
什么是escape
浏览器会将一些保留字符解析为HTML代码,比如:
<被解析为标签的开头>被解析为标签的结尾''被解析为属性值的开头和结尾
为了将这些保留字符显示为文本(不被解析为HTML代码),可以将其替换为对应的entity(HTML实体):
<的实体为<>的实体为>''的实体为"
这种将
HTML字符替换为entity的方式被称为escape(转义)
什么是sanitize
对于上面的HTML字符串:
const str = "<img src='' onerror='alert(0)'>";除了转义''来规避XSS风险,还有一种更直观的思路:直接过滤掉onerror属性。
这种直接移除
HTML字符串中有害的代码(比如<script>)的方式被称为sanitize(消毒)
需要用到一个API——Sanitizer[2]。
首先我们通过Sanitizer构造实例:
const sanitizer = new Sanitizer();调用实例的sanitizeFor方法,传入容器元素类型以及要消毒的HTML字符串:
sanitizer.sanitizeFor("div", str);会得到一个HTMLDivElement(即我们传入的容器元素类型),其内部包含一个没有onerror属性的img:

默认情况下Sanitizer会移除所有可能导致JS执行的代码。
丰富的配置
Sanitizer不仅开箱即用,还提供丰富的白名单、黑名单配置:
const config = {
allowElements: [],
blockElements: [],
dropElements: [],
allowAttributes: {},
dropAttributes: {},
allowCustomElements: true,
allowComments: true
};
new Sanitizer(config)比如,allowElements定义元素白名单,只有名单内的元素会被保留,与之对应的blockElements是元素黑名单:
const str = `hello <b><i>world</i></b>`
new Sanitizer().sanitizeFor("div", str)
// <div>hello <b><i>world</i></b></div>
new Sanitizer({allowElements: [ "b" ]}).sanitizeFor("div", str)
// <div>hello <b>world</b></div>
new Sanitizer({blockElements: [ "b" ]}).sanitizeFor("div", str)
// <div>hello <i>world</i></div>
new Sanitizer({allowElements: []}).sanitizeFor("div", str)
// <div>hello world</div>allowAttributes是属性白名单,与之对应的dropAttributes是属性黑名单,对于如下配置:
{
allowAttributes: {"style": ["span"]},
dropAttributes: {"id": ["*"]}}
}代表消毒后的HTML:
只允许
span元素拥有style属性移除所有元素(
*通配符代表所有元素)的id属性

兼容性
这么香的API兼容性怎么样呢:


当前只有在Chrome 93之后,开启试验标识后可使用:
about://flags/#enable-experimental-web-platform-features虽然原生Sanitizer离稳定还遥遥无期,但你可以使用DOMPurify[3]库实现类似功能。
后记
日常你更倾向使用escape还是sanitize呢?
参考资料
[1]
Safe DOM manipulation with the Sanitizer API: https://web.dev/sanitizer/
[2]Sanitizer: https://wicg.github.io/sanitizer-api/
[3]DOMPurify: https://github.com/cure53/DOMPurify
本文介绍了在处理可能含有风险的DOM时,如何利用浏览器的Sanitizer API来防止XSS攻击。Sanitizer API提供了转义和消毒两种方式,其中转义通过替换HTML特殊字符为实体来避免解析,而消毒则是直接过滤掉有害代码。文章详细讲解了Sanitizer API的使用方法,包括默认配置和自定义配置,并对比了与DOMPurify库的相似功能。最后讨论了Sanitizer API的兼容性和实际应用中选择转义或消毒的考量。
142

被折叠的 条评论
为什么被折叠?



