待望の新アーキテクチャのGPUが登場。
より汎用計算向きの構成が取られており、非常に楽しみ。
特にSM単位で命令発行でき、L1などの容量も大幅に改善されているのが気になる。
あとは性能とソフトウェア環境の整備次第なのか。
http://pc.watch.impress.co.jp/docs/column/kaigai/20111222_501138.html
APP SDK 2.6ではOpenCL 1.2の仕様の一部が利用可能になっており、
特にカーネルコードでC++98の一部が記述可能になったそうだ。
具体的には、ホストで作ったクラスをカーネルに転送し、
カーネル関数でアクセスするなどかなり自由度が上がっている。
また、カーネル関数のオーバーロードやテンプレートも作成できる。
そのほかの改善としては、APUでのAtomicカウンタの対応と、
非同期メモリコピーの実現が挙げられる。
もちろんRadeon HD79xx対応も行われている。
http://developer.amd.com/sdks/AMDAPPSDK/assets/AMD_APP_SDK_Release_Notes_Developer.pdf
ただし、未だにLinuxでのZero Copyには対応できていない。
現状、自分の研究にはOpenCL + AMD APUは利用できなさそうだ。
新学期
13 年前
0 件のコメント:
コメントを投稿