场景:
将UTF-8编码的模版文件读入内存,然后转换后存储为html文件。
注意点:
utf-8编码的文件开头有3个附加字节:0xEF 0xBB 0xBF
unicode编码的文件开头有2个附加字节:0xFF 0xFE (little endian),或者0xFE 0xFF(big endian)
ANSI编码则没有附加字节
如果读写不当, 可能得不到预期结果(html会显示为乱码)
读示例:
写示例:
本文介绍如何正确处理UTF-8编码的模板文件,包括读取文件内容到内存并转换为HTML文件的过程。文章强调了UTF-8编码的特殊字节标记及正确的读写方式,避免出现乱码。
场景:
将UTF-8编码的模版文件读入内存,然后转换后存储为html文件。
注意点:
utf-8编码的文件开头有3个附加字节:0xEF 0xBB 0xBF
unicode编码的文件开头有2个附加字节:0xFF 0xFE (little endian),或者0xFE 0xFF(big endian)
ANSI编码则没有附加字节
如果读写不当, 可能得不到预期结果(html会显示为乱码)
读示例:
写示例:

被折叠的 条评论
为什么被折叠?