CUDA学习笔记——并行编程的通讯模式
并行计算:非常多的线程在合作解决一个问题。
■1. 映射Map
■2. 聚合gather
■3. 分散scatter
■4. 模板stencil
■5. 转换transpose
■6. 压缩reduce
■7. 重排scan/sort
1.映射Map,一一对应,举例:把数组x的每一个元素都放大三倍,输出到数组y
2.聚合gatter:多对一,举例:把数组x[0]+x[1]+x[2]取均值放到y[0],把数据x[1]+x[2]+x[3]取均值放到y[1]……
3.分散scatter,一对多,与第二点相反
4.模板stencil,如图所示
5.转置transpose, 如图所示
6.压缩reduce,逐步减少,类似映射Map
7.重排 scan/sort ,以我们希望的一种计算模式进行重新排列,输入的数量不一定