2011年4月22日金曜日

4/22 実験



レイテンシとスループットを測定
それぞれ順番に、
CL_MEM_ALLOC_HOST_PTR
CL_MEM_USE_HOST_PTR
CL_MEM_USE_PERSISTENT_MEM_AMD
でメモリオブジェクトを確保した場合の実行結果。
他の条件は全く同じ。

使い方が間違っている可能性もあるが、
CL_MEM_USE_PERSISTENT_MEM_AMDが微妙。

CL_MEM_ALLOC_HOST_PTRはZero Copyの恩恵なのか、
Map/Unmapが速く、いい感じだと思う。

ただ、全体的にCPUと比べて高レイテンシすぎて心配になる。

0 件のコメント:

コメントを投稿