GPU

依然是NVPROF的research。获取数据需要记录GPU运行的总时间。因为Cuda基于C/C++,毫无疑问使用C++的Timer是可行的。但是time.h中的clock函数精度受制于 时钟计时单元的长度,即通常精度也为1毫秒,故还是推荐使用Cuda事件来进行时间...

发布 0 条评论