レイテンシとスループットを測定
それぞれ順番に、
CL_MEM_ALLOC_HOST_PTR
CL_MEM_USE_HOST_PTR
CL_MEM_USE_PERSISTENT_MEM_AMD
でメモリオブジェクトを確保した場合の実行結果。
他の条件は全く同じ。
使い方が間違っている可能性もあるが、
CL_MEM_USE_PERSISTENT_MEM_AMDが微妙。
CL_MEM_ALLOC_HOST_PTRはZero Copyの恩恵なのか、
Map/Unmapが速く、いい感じだと思う。
ただ、全体的にCPUと比べて高レイテンシすぎて心配になる。
0 件のコメント:
コメントを投稿