HTML网页内容判断该网页使用的字符集

网页字符集解析方法

最新推荐文章于 2025-09-20 18:04:25 发布

转载最新推荐文章于 2025-09-20 18:04:25 发布 · 1.3k 阅读

文章标签：

#html #正则表达式 #null

javascript 专栏收录该内容

15 篇文章

订阅专栏

本文介绍了一种简单有效的网页字符集解析方法，通过使用正则表达式从HTML内容中匹配出字符集信息，若未找到则默认使用UTF-8。

要回答这个问题，首先需要获取当前网页正确的字符集。代码： //===============================================================================//Function Name: CharSetDetector//Description: 根据HTML网页内容判断该网页使用的字符集//Parameter(s): oText HTML网页内容//Return: 使用的字符集//===============================================================================

function CharSetDetector(oText)...{

var charset; //自动判断编码开始

var charSets = oText.match(/charset=(S+)"/i);

if (charSets != null){

charset = charSets[1];

}else{

charset = "UTF-8" //缺省采用UTF-8编码

} //自动判断编码结束

return charset;

}

通过代码大家可以了解到，使用一个很简单的正则表达式，我们很容易就把当前网页的字符集解析出来了。