CUDA Thrust sort 与C++ STL sort速度对比
1.测试平台:
CPU:Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10GHz
GPU:nvidia tesla p100
memory:32GB
CUDA 9.0 GCC 4.8
2.试验结果
2.1 NVIDIA_CUDA-9.0_Samples/6_Advanced/radixSortThrust
1000元素
一百万元素
元素个数 | 时间 |
---|---|
1000 | 0.00045s |
1十万 | 0.00025s |
1百万 | 0.00098s |
1千万 | 0.00266s |
试验结果: