Net4.0 Parallel编程（一）Data Parallelism 上

转载于 2012-02-10 09:56:00 发布 · 76 阅读

CC 4.0 BY-SA版权

原文链接：http://www.cnblogs.com/dajiang02/archive/2012/02/10/2344885.html

本文介绍在.NET 4.0中使用System.Threading.Tasks命名空间下的Parallel.For及Parallel.ForEach方法实现并行处理，通过对比普通循环与并行循环的执行效率，探讨了并行编程的优势与局限。

现在已经进入了多核的时代，我们的程序如何更多的利用好cpu，答案是并行处理。在.net4.0之前我们要开发并行的程序是非常的困难，在.net4.0中，在命名空间System.Threading.Tasks提供了方便的并行开发的类库。本文中主要看看Data Parallel，

看看并行的For、Foreach。

Parallel.For

首先先写一个普通的循环：

          private 
          void 
          NormalFor() 
         
          { 
         
          for 
          (var i = 0; i < 10000; i++) 
         
          { 
         
          for 
          (var j = 0; j < 1000; j++) 
         
          { 
         
          for 
          (var k = 0; k < 100; k++) 
         
          { 
         
          DoSomething(); 
         
          } 
         
          } 
         
          } 
         
          }

再看一个并行的For语句：

          private 
          void 
          ParallelFor() 
         
          { 
         
          Parallel.For(0, 10000, i => 
         
          { 
         
          for 
          (
          int 
          j = 0; j < 1000; j++) 
         
          { 
         
          for 
          (var k = 0; k < 100; k++) 
         
          { 
         
          DoSomething(); 
         
          } 
         
          } 
         
          }); 
         
          }

看下测试方法：

          [TestMethod()] 
         
          public 
          void 
          TestForLoop()  
         
          { 
         
          _StopWatch.Start(); 
         
          this
          .NormalFor(); 
         
          _StopWatch.Stop(); 
         
          Console.WriteLine(
          "NormalForLoop Runned Time:{0}"
          , _StopWatch.ElapsedMilliseconds); 
         
          _StopWatch.Reset(); 
         
          _StopWatch.Start(); 
         
          this
          .ParallelFor(); 
         
          _StopWatch.Stop(); 
         
          Console.WriteLine(
          "Parallel Loop:{0}"
          , _StopWatch.ElapsedMilliseconds); 
         
          }

测试结果：

上面的例子中，只是将最外层的For语句替换成了Parallel.For，我们可以看到Parallel执行速度提高了近一倍。下面我把里面的循环也改成并行的：

          private 
          void 
          ParallelNestedFor() 
         
          { 
         
          Parallel.For(0, 10000, i => 
         
          { 
         
          Parallel.For(0, 1000, j => 
         
          { 
         
          for 
          (var k = 0; k < 100; k++) 
         
          { 
         
          DoSomething(); 
         
          } 
         
          }); 
         
          }); 
         
          }

结果：

也许会令我们感到惊讶的是：嵌套Paralled For之后速度并没有更快，反而稍微慢了。其实是这样的，因为我们的示例中大部分操作是在最外层循环，而在并行操作中会需要缓存数据等会浪费一定的性能。当我们把最外层的循环调整成100，中间层为10000时，我们来看下结果：

所以，是否需要嵌套的时候，需要我们根据一些实际情况来决定，不过对于大部分操作，最外层的并行处理已经足够了。

Parallel.ForEach

我们来看两段很简单的代码：

          private 
          void 
          NormalForeach()  
         
          { 
         
          foreach 
          (var file 
          in 
          GetFiles()) 
         
          { 
         
          DoSomething(); 
         
          } 
         
          } 
         
          private 
          void 
          ParallelForeach() 
         
          { 
         
          Parallel.ForEach(GetFiles(), file => { 
         
          DoSomething(); 
         
          }); 
         
          }