Thursday, June 7, 2012

Pinned memoryにしても転送量が多いと遅い

かなり転送量が多い仕事をさせているので,Pinned memory化して,高速化を図った.
たぶん高速になっているのだろうけれど,実感するレベルではない.

実装方法は,OpenCL Best Practices Guide, Chapter 3. Memory Optimizations の通り.
このガイドの入手法は,次の①-③でインストールしてできたOpenCLのフォルダに入っていました.
①http://developer.nvidia.com/cuda-downloads
②Download SDKで入るgpucomputingsdk_4.2.9_win_64をゲット
③インストール


No comments: