CUDA Thrust sort 与C++ STL sort速度对比

CUDA Thrust sort 与C++ STL sort速度对比


1.测试平台:

CPU:Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz       

GPU:nvidia tesla p100  

CUDA Thrust sort 与C++ STL sort速度对比       

memory:32GB      

CUDA 9.0     GCC 4.8

2.试验结果

2.1 NVIDIA_CUDA-9.0_Samples/6_Advanced/radixSortThrust
 1000元素CUDA Thrust sort 与C++ STL sort速度对比

 一百万元素CUDA Thrust sort 与C++ STL sort速度对比


试验结果
元素个数 时间
1000 0.00045s
1十万 0.00025s
1百万 0.00098s
1千万 0.00266s
2.2 自己写的STL_sort与thrust_sort

CUDA Thrust sort 与C++ STL sort速度对比

CUDA Thrust sort 与C++ STL sort速度对比

试验结果:

CUDA Thrust sort 与C++ STL sort速度对比

CUDA Thrust sort 与C++ STL sort速度对比

CUDA Thrust sort 与C++ STL sort速度对比

CUDA Thrust sort 与C++ STL sort速度对比

CUDA Thrust sort 与C++ STL sort速度对比


第一次写博客,如有不足,请多谅解!