页面乱码问题根源浅析


·        作者Laruence(   )

·        本文地址http://www.laruence.com/2008/04/17/110.html

·        转载请注明出处

这个问题已经遇到过俩次了,就是页面中明确指明了编码是UTF8,但是显示是乱码。

虽然知道解决方法,也知道是Apache的原因,但是一直没有去找其所以然,今天趁机,就研究了一下。

首先, 关闭PHP配置文件php.ini中的default_charset:

1. 页面没有指定charset Apache配置defaultcharst gbk , 页面文件编码是utf-8

结果: 乱码,使用wireshark抓包,发现服务器返回的header中指明了:

1.       Content-Type:text/html;charset=GBK

结论:当页面没有指明charset的时候,Apachedefaultcharset起作用

2. 页面指定charsetutf-8,Apache配置defaultcharset gbk. 页面文件是utf-8

1.       <head>

2.               <metahttp-equiv="Content-Type"content="text/html; charset=utf-8"/>

3.       </head>

4.       <body>

5.               <divid="page-header">

6.                测试Apache DefaultCharset

7.               </div>

8.       </body>

9.       </html>

结果还是出现乱码。

结论:当Apache配置了DefaultCharset, 将忽略页面的charset申明。

3. PHPheader申明charsetutf8, Apache配置defaultcharstgbk,页面文件编码是utf8

1.       header("Content-Type:text/html; charset=utf-8");

结果页面显示正常。

4Apache设置DefaultCharset off

结果,页面显示正常。

翻阅了下Apache2的手册:

1.       AddDefaultCharset指令

2.       说明当应答内容是text/plaintext/html时,在HTTP应答头中加入的默认字符集

3.       语法AddDefaultCharsetOn|Off|charset

4.       默认值AddDefaultCharsetOff

5.       作用域serverconfig,virtualhost,directory,.htaccess

6.       覆盖项FileInfo

7.       状态核心(C)

8.       模块core

9.        

10.    当且仅当应答内容是text/plaintext/html时,此指令将会在HTTP应答头中加入的

11.    默认字符集。理论上这将覆盖在文档体中通过<meta>签指定的字符集,但是实际

12.    的行为通常取决于用户浏览器的设置。AddDefaultCharsetOff将会禁用此功能。

13.     

14.    AddDefaultCharsetOn将启用Apache内部的默认字符集iso-8859-1。您

15.    也可以指定使用在IANA注册过的字符集名字中的另外一个charset

16.    比如说:

17.    AddDefaultCharsetutf-8

也就是说,当Apache不指定defaultcharset的时候,页面编码由页面自己的meta标签指定。

Apache指定的时候,将忽略页面中的meta标签指定的编码. 但是容许脚本直接header编码方式给客户端

最后,还有一个问题没有得出结果:

Apache和页面都没有指定的时候,又如何?

我在自己的机器上,如果都不指定,默认还是utf8.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值