要回答这个问题,首先需要获取当前网页正确的字符集。 代码: //===============================================================================//Function Name: CharSetDetector//Description: 根据HTML网页内容判断该网页使用的字符集//Parameter(s): oText HTML网页内容//Return: 使用的字符集//===============================================================================
function CharSetDetector(oText)...{
var charset; //自动判断编码开始
var charSets = oText.match(/charset=(S+)"/i);
if (charSets != null){
charset = charSets[1];
}else{
charset = "UTF-8" //缺省采用UTF-8编码
} //自动判断编码结束
return charset;
}
通过代码大家可以了解到,使用一个很简单的正则表达式,我们很容易就把当前网页的字符集解析出来了。
本文介绍了一种简单有效的网页字符集解析方法,通过使用正则表达式从HTML内容中匹配出字符集信息,若未找到则默认使用UTF-8。
708

被折叠的 条评论
为什么被折叠?



