deep learning**函数实现之cudnn
代码不方便上传,只能传图片。
注意:cudnn对于输入的维度限制为4~8,少于4维的数据可以把多余的维度的shape设置为1,多余8维的数据则无能为力了。cudnn对于输入数据的size限制为最多20亿,也就是说输入数组的元素的个数最多为20亿。
先看kernel头文件:
kernel cpp文件:
run:
代码不方便上传,只能传图片。
注意:cudnn对于输入的维度限制为4~8,少于4维的数据可以把多余的维度的shape设置为1,多余8维的数据则无能为力了。cudnn对于输入数据的size限制为最多20亿,也就是说输入数组的元素的个数最多为20亿。
先看kernel头文件:
kernel cpp文件:
run: