GPU架构的三层“exploit” GPU架构相比CPU架构快的原因 多人工作,去掉管理者 不像CPU那样需要做自动的优化(流水线,层次缓存,分支预测等等),把这部分的资源消耗拿出来,多来一下实际工作的单元(多核心) SIMT 单指令多线程,把一个工作单元内放置多个线程,这些线程共享相同的指令,相当于给一个单元“三头六臂” 延迟隐藏 当某个操作在等待数据的时候,去做其它的指令(到要求指令之间存在独立性)