避免Adodb.Stream输出UTF-8时自动写入的BOM（asp）

最新推荐文章于 2023-02-10 22:40:40 发布

转载最新推荐文章于 2023-02-10 22:40:40 发布 · 3.8k 阅读

介绍如何使用Adodb.Stream组件生成无BOM的UTF-8编码HTML文件，包括读取模板、内容替换及保存过程。

asp生成html如果采用utf8编码方式，多数采用的是Adodb.Stream组件，因为fso并不能支持Utf-8

      最近在写一个生成HTML页面的程序，模板是一个UTF-8的HTML文件，在这个文件里已经去除了BOM。现在用ADODB.STREAM读取模板，添加内容，然后输出为UTF-8的HTML网页。但我检查这个HTML时发现被自动加上了BOM。导致<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">申明错误，从而使div布局的页面样式发生错误。

      关于什么是BOM这里不作讨论，如果不明白可以去google一下，但是在这个实例中我们不希望文件开头包含这个BOM。

      有没有解决办法？

      最直接简单的做法可以这样：
我们已经知道BOM占用3个字节，那么我们可以在stream中写入UTF-8字符串之后，将stream转换为二进制类型，然后跳过头3个字节，并将剩下的字节用CopyTo()方法拷贝到一个新的stream中去。不过这样好像有潜在的很严重的性能问题，如果这个文本流比较大，那么处理这个流是不是就要耗费双倍的资源？

      那我们将上面的方案改进一下。
经过测试发现，stream在“UTF-8”编码的Text方式下首次调用WriteText()方法时，会自动在stream的最开始加入3个字节。
更严格的说，在以下状态下
stream.Position = 0; // 流的位置在最开始时
stream.Type = 3; // adTypeText
stream.Charset = 'UTF-8';
调用stream.WriteText()方法时，stream会自动先在流的最开始插入3个字节的BOM。

      而stream.Position在任何非0值的情况下，调用WriteText()方法都不会再插入BOM了，可以利用这一点来避免自动插入BOM。

假如我们需要朝stream中写入10个UTF-8字符，我们先按照通常方式在一个刚创建的stream中只写入第一个UTF-8字符。

之后将stream转换为二进制类型(adTypeBinary)，跳过stream开始的3个BOM字节，并读出剩余的字节（这些字节应该只包含刚刚一个字符的数据，不含其它杂质）。

      再回到流的开始，将刚刚读出的字节重新写入流，写完后立即调用SetEOS()方法将当前位置设为流末尾。

      然后将stream重新转换回文本类型(adTypeText)，并将流当前位置移到流末尾。

      此时继续写入剩余的9个UTF-8字符，stream会将其编码后的字节数据直接添加到尾部，而不会再插入BOM了。

      此后若需要继续往stream中写入文本，直接调用WriteText()方法即可。

      通过测试可以发现，如上方式写入的UTF-8字符串通过ReadText()方法也能正常读出，但是stream.Size却比传统方式直接写入UTF-8的stream小3，很明显就是少了那3个“多余”的BOM字节。

      问题到此还未结束。
      此时你可能想直接调用stream.SaveToFile()方法保存到文件，你可能会发现，这时保存的文件中还是带有BOM，上述方法无效？

      出现这种情况，是因为你漏掉了关键的一步：在调用SaveToFile()方法之前，需要将流转换为二进制类型。

      原来还是Adodb.Stream在自作聪明，输出的时候发现UTF-8文本流的开头缺少BOM，又会再次将其加上。

      但是若将流类型改为二进制，输出时就可以绕过Adodb.Stream的BOM监测了。

'***********************************************
'函数名：LoadFile
'作用：利用ADODB.Stream读取模板文件
'参数：File：要读取的文件
'Author：Evller
'***********************************************
Function LoadFile(ByVal File)
Dim objStream
   On Error Resume Next
   Set objStream = Server.CreateObject("ADODB.Stream")
   If Err.Number=-2147221005 Then
      Response.Write "<div align='center'>非常遗憾,您的主机不支持ADODB.Stream,不能使用本程序</div>"
      Err.Clear
      Response.End
   End If
   With objStream
      .Type = 2
      .Mode = 3
      .Open
      .LoadFromFile Server.MapPath(File)
      If Err.Number<>0 Then
   Response.Write "<div align='center'>文件<font color='#ff0000'>"&File&"</font>无法被打开，请检查是否存在!</font></div>"
   Err.Clear
   Response.End
      End If
      .Charset = "utf-8"
      .Position = 2
      LoadFile = .ReadText
      .Close
   End With
   Set objStream = Nothing
End Function

'******************************************************************************
'函数名：SaveToFile
'作用：生成html静态页面，去掉bom标签文件
'参数： Content内容,FileName路径
'Author：Evller
'******************************************************************************
Sub SaveToFile (Content,FileName)
dim stm:set stm=server.CreateObject("adodb.stream")
stm.Type=2 '以文本模式读取
stm.mode=3
stm.charset="utf-8"
stm.open
stm.Writetext (content)
stm.Position = 3
dim newStream:Set newStream = Server.CreateObject("adodb.stream")
With newStream
      .Mode = 3
      .Type = 1
      .Open()
End With
stm.CopyTo(newStream)
newStream.SaveToFile server.MapPath(FileName),2
stm.flush
stm.Close
Set stm = Nothing
Set newStream = Nothing
End Sub

实例：
List="news list!"

Content=LoadFile("template.htm")'先利用LoadFile读取模板template.htm内容

Content = Replace(Content,"{$list$}",list)'把模板中的内容替换

Call SaveToFile(Content,"index.htm")'生成文件html文件

Response.Write "生成成功!"

r