很早前做过一个ASP.NET的多语言版本的小系统,其中一个功能是将报表导出为csv文件。以前的实现方式是先在服务器创建一个UTF-8的临时文件,然后将文件流输出至浏览器。一直这样来用,没有什么问题。
最近想修改一下,因为觉得每次都要创建文件有些不爽。于是直接将内存中csv的内容输出至浏览器(Response的Encoding也是utf-8)。在client端下载文件后,使用记事本、editplus、ultra-edit等工具打开均可以正常显示,但是用excel打开时,所有的中文均变成乱码。
于是将前一种方式下载的文件命名为A.CSV,后一种方式的命名为B.CSV。仔细比较过两种方式生成文件内容,一模一样,在editplus下查看encoding,均为utf-8编码。
在MSDN上确认了EXCEL不支持UTF-8格式。之后在网上看了下unicode的BOM介绍,自己动手用ultra-edit以二进制方式打开两个文件,原来是A的方式生成有unicode的BOM签名,而B的没有,所以导致了A可以正常被显示,而B显示为乱码。
没办法,只好采用前一种方式了...