OpenACC・CUDAによるGPUコンピューティング
作者: admin
â
最終変更
2014年09月05日 16時07分
2014年前期に行われたCMSI計算科学技術特論Bの講義「第14回 OpenACC・CUDAによるGPUコンピューティング」の紹介をしています。
(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。
1. GPUコンピューティング、CUDAの概要
- GPUコンピューティング ( P.3, ビデオ画像)
- GPUの構造 ( P.8, ビデオ画像)
- CUDAプログラミングモデル ( P.11, ビデオ画像)
- SAXPY(Y=A*X+Y) ( P.16, ビデオ画像)
2. OpenACC
- 実行モデル ( P.21, ビデオ画像)
- SAXPY(Y=A*X+Y) ( P.22, ビデオ画像)
- OpenMPとの併用 ( P.25, ビデオ画像)
- 例:Jacobi iteration ( P.32, ビデオ画像)
- データ転送 ( P.37, ビデオ画像)
3. カーネルチューニング
- カーネルチューニング(Loop construct) ( P.47, ビデオ画像)
- 実行条件設定(Vector clause) ( P.50, ビデオ画像)
- カーネルチューニング(Loop construct) ( P.51, ビデオ画像)
4. MPIとは簡単に併用できるの?
- MPI並列(Halo exchange) ( P.55, ビデオ画像)
- MPI Jacoi iteration ( P.56, ビデオ画像)
- オーバーラップ(Async/Wait clause) ( P.60, ビデオ画像)
- まとめ(P.67, ビデオ画像)