C#下默认的是unicode编码
但是比如,我使用以下代码,从某网站上下载网页,而该网页是Utf-8编码的,这时,在vs2005调试时,显示出来的中文就乱码了。
string sHtml = client.DownloadString(sUrl);
经过多方尝试,我用下列操作搞出来了正确的编码了,但是其中的原理,我并不明白。
byte[] byteArray = Encoding.Default.GetBytes(sHtml);
string s1 = System.Text.Encoding.UTF8.GetString(byteArray);
知其然而不知其所以然啊,有人知道不?为什么我读取GB编码的网页到C#就不用转换啊?
探讨了在C#中处理不同编码的网页内容时遇到的问题及解决方法。作者在使用C#下载UTF-8编码的网页时遇到了中文乱码的情况,并通过特定步骤解决了编码问题。
5263

被折叠的 条评论
为什么被折叠?



