用PHP的TIDY处理中文网页时,结果总是乱码,总结肯定是字符编码的问题,经过研究发现一定要设置TIDY的字符属性
// "char-encoding" => "raw",
// "input-encoding" => "raw",
"output-encoding" => "raw"
以两个设不设置没有关系,因为主要看输出。
设置为"raw"后,TIDY将直接输出超过127的字符,而不再对它们进行编码。
但这之前,你因为保证原始的编码是PHP可读的,
如果原始编码是ASCII的好像是无法转到UTF8的,必须是UTF8转UTF8,这块比较乱,如果谁搞明白了,请给我留言吧
反正如果你是ASCII编码的中文把输出设置成raw就对了。
PHP TIDY处理中文网页
本文介绍使用PHP的TIDY处理中文网页时遇到乱码问题的解决办法。通过设置TIDY的字符属性为raw,可以避免TIDY对非ASCII字符进行编码,从而解决乱码问题。
2951

被折叠的 条评论
为什么被折叠?



