从WEB SERVICE 上返回大数据量的DATASET

本文详细介绍了如何利用Microsoft .NET Framework中的序列化技术(如Formatter类别、DataSetSurrogate)来减少网络传输量并提高性能。通过对比SoapFormatter与BinaryFormatter在序列化SQL范例库Northwind时的表现,以及结合使用DataSetSurrogate进行进一步压缩,实现了数据的有效压缩。同时,提供了序列化数据为文件或Byte[]形式在客户端的实现方法,并讨论了不同方式的优缺点。最后,作者分享了在实际应用中遇到的问题及解决方案,强调了减少数据量的重要性,但同时也指出优化CPU开销的挑战。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、用序列化的方式来减少网络传输量
Microsoft .NET Framework 1.x 中内建两种将物件序列化的 Formatter类别,SoapFormatter  BinaryFormatter,两种方式均能减轻网络传输量提高性能,SoapFormatter方式传输的方式其实还是XML形式,加了很多XML标识,因此压缩率不是很理想,BinaryFormatter用纯二进制的方式序列化DATASET,能使压缩率大大提高,这是台湾作者李匡正 (台灣微軟應用架構技術經理提供的例子里对SQL范例库Northwind的测试结果:很显示然BinaryFormatter 明显优于SoapFormatter ,而我也确实用了BinaryFormatter 这种方式实现了提高效率.

 

SoapFormatter 

BinaryFormatter 

Dataset 序列化後 Bytes 數 

1,953,078

1,448,399 


再者,用微软提供的DataSetSurrogate 类可以此基础上进一步压缩数据大小,DataSetSurrogate .net 2.0里自带。这是比较结果.

 

SoapFormatter

BinaryFormatter

Dataset 序列化後Bytes

1,953,078

1,448,399

DataSetSurrogate 序列化後Bytes

2,371,942

575,684

     

在这里,有两种方式:可把序列化后的数据用文件形式保存在客户端硬盘;也可用Byte[]方式传回客户端,以下是代码
web service (文件形式)

  [WebMethod(Description="循环获取远程DATASET")]

  public void SurrogateReadTable(string TableName)

  {

   //把DataSet通过Surrogate Class 序列化成 Binary Stream

  

   DataSet ds;

   ds=SqlHelper.ExecuteDataset(cnn,CommandType.Text,"select * from "+TableName);

   //实例化DataSetSurrogate,传取出的DATASET到构造函数里

   sds = new DataSetSurrogate(ds); 

   //实例化二进制流

   BinaryFormatter bf=new BinaryFormatter();

   StreamWriter swDat; 

   //写到本地一个文件里

   swDat = new StreamWriter(@"c:"output_surrogate_dataset.dat");

   bf.Serialize(swDat.BaseStream, sds);

   //这里可以知道序列化后的文件的大小

   long size = swDat.BaseStream.Length;

   swDat.Close();

  

  }


客户端

private void button1_Click(object sender, System.EventArgs e)

  {

   label1.Text=DateTime.Now.ToString();



   button1.Enabled=false;

   //反序列化Binary Stream能通过Surrogate Class转换成 DataSet



   //从WEB SERVICE上读取方法

   svs.SurrogateRead("t_busdocbase");

   BinaryFormatter bf=new BinaryFormatter();

   StreamReader swDat; 

   swDat = new StreamReader(@"c:"output_surrogate_dataset.dat");

   object o=bf.Deserialize(swDat.BaseStream);

  DataSet ds;

   sds = (DataSetSurrogate) o;

   ds = sds.ConvertToDataSet();

   dataGrid1.DataSource=ds.Tables[0];

   swDat.Close();

   }




 

web service (Byte[]方式)

      [WebMethod(Description="获取业务资料远程DATASET")]

      public byte[] SurrogateRead1()

      {

       DataSet ds;

       ds=SqlHelper.ExecuteDataset(cnn,CommandType.Text,"select * from t_busdocbase");

       sds = new DataSetSurrogate(ds); 

       MemoryStream s= new MemoryStream();

       BinaryFormatter bf = new BinaryFormatter();

       bf.Serialize(s,sds);

     

       byte[] e = s.ToArray();

       return e; 

  

      }





客户端   

   private void button3_Click(object sender, System.EventArgs e)

   {

    label1.Text=DateTime.Now.ToString();



    button3.Enabled=false;

    //*反序列化Binary Stream能通过Surrogate Class转换成 DataSet*/



    //从WEB SERVICE上读取方法





     byte [] bb=svs.SurrogateRead1();

     MemoryStream br=new MemoryStream(bb);

     BinaryFormatter bf=new BinaryFormatter();

     object o=bf.Deserialize(br);

     sds = (DataSetSurrogate) o;

     ds = sds.ConvertToDataSet(); 

     dataGrid1.DataSource=ds.Tables[0];



     br.Close();



    }


我个人觉得用byte[]方式会安全些,毕竟不用在客户端产生文件,不用担心数据的安全。当然作为从网络上读取数据来
说,
10W条是一个不小量,所有的方式包括压缩,序列化等都是权宜之计,而不是长久之计,在使用当中,我用以上
的方法虽然能使网络传输量降低,且可在很短时间内就把数据显示在
DATAGRID上,但CPU的开销却达到了100%
这是我一直头疼的。我后来又用了分页的方式,把
10W条数据在服务器端就分批取出,每次500条,这样读取时间延长了,但CPU开销却未减轻很多,再后来,又用多线程的方式处理,不甚理想。因此最好的方法就是尽可能的不查询
10W条数据,通过条件判断等方式减少所需处理的数据量。

作者:JackYang
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值