かなり転送量が多い仕事をさせているので,Pinned memory化して,高速化を図った.
たぶん高速になっているのだろうけれど,実感するレベルではない.
実装方法は,OpenCL Best Practices Guide, Chapter 3. Memory Optimizations の通り.
このガイドの入手法は,次の①-③でインストールしてできたOpenCLのフォルダに入っていました.
①http://developer.nvidia.com/cuda-downloads
②Download SDKで入るgpucomputingsdk_4.2.9_win_64をゲット
③インストール
No comments:
Post a Comment