浏览器都提供了查看网页源代码的功能,打开网页源代码,我们会发现大部分源代码中都包含了这样一行代码:
<meta http-equiv="content-type" content="text/html;charset=utf-8"/>
或者
<meta http-equiv="content-type" content="text/html;charset=gb2312"/>
这行代码是什么意思呢?就是提示浏览器,要以UTF-8或者GB2312的字符编码格式显示网页内容。
如果没有这行代码,网页在浏览器中显示时就有可能产生乱码,这是因为浏览器会以它默认的字符编码格式显示网页的内容,这个格式与操作系统的语言环境一致。
另外,需要特别注意的是:
网页的编码格式,要与charset的字符编码格式保持一致,否则,在浏览器中显示网页内容时就会出现乱码。
gb2312是一种简体中文编码格式,utf-8是一种Unicode转码格式(Unicode Transformation Format),因此我们推荐使用utf-8格式,以使网页能支持更多的字符和语言环境。
nodepad++是一种很好用的文本编辑器,支持utf-8编码,常用来编辑网页代码。nodepad++支持的utf-8编码格式有两种(UTF-8无BOM格式编码和UTF-8格式编码)。
一个带标签,一个没有标签。BOM是Byte Order Mark(定义字节顺序),因为在网络传输中分两种顺序:大头和小头;由于兼容性问题,带BOM的UTF-8在一些浏览器中会显示
为乱码,因此推荐用UTF-8无BOM格式编码,也就是nodepad++ 默认的字符编码格式。