Hybrid並列化技法(MPIとOpenMPの応用)
作者: admin
â
最終変更
2014年07月29日 14時34分
2013年前期に行われたCMSI計算科学技術特論Aの講義「第4回 Hybrid並列化技法(MPIとOpenMPの応用)」をもとに、Hybrid並列化技法に関して解説しています。
(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。
1. 実際の並列計算機構成例
- 東京大学情報基盤センタースパコン T2Kオープンスパコン (東大版) (HA8000クラスタシステム) ( P.4, ビデオ画像 )
- T2K (東大) での全体メモリ構成図 ( P.6, ビデオ画像 )
- 東京大学情報基盤センタースパコン FX10スーパーコンピュータシステム ( P.8, ビデオ画像 )
- FX10の通信簿 (1TOFU単位) ( P.10, ビデオ画像 )
- FX10の通信簿 (1TOFU単位間の結合) ( P.11, ビデオ画像 )
2. バッチ処理とMPIジョブの投入
- FX10スーパーコンピュータシステムでのジョブ実行形態の例 ( P.13, ビデオ画像 )
- バッチ処理とは ( P.14, ビデオ画像 )
- コンパイラの種類とインタラクティブ実行およびバッチ実行の例 (FX10) ( P.15, ビデオ画像 )
- バッチキューの設定の仕方 (FX10の例) ( P.16, ビデオ画像 )
- インタラクティブ実行のやり方の例 (FX10スーパーコンピュータシステム) ( P.17, ビデオ画像 )
- pjstat --rsc の実行画面例 ( P.18, ビデオ画像 )
- pjstat --rsc -x の実行画面例 ( P.19, ビデオ画像 )
- pjstat --rsc -b の実行画面例 ( P.20, ビデオ画像 )
- JOBスクリプトサンプルの説明 (ピュアMPI) (hello-pure.bash, C言語, Fortran言語共通) ( P.21, ビデオ画像 )
- 並列版Helloプログラムを実行しよう (ピュアMPI) ( P.23, ビデオ画像 )
- バッチジョブ実行による標準出力、標準エラー出力 ( P.24, ビデオ画像 )
- 並列版Helloプログラムを実行しよう (ハイブリッドMPI) ( P.25, ビデオ画像 )
- JOBスクリプトサンプルの説明 (ハイブリッドMPI) (hello-hy16.bash, C言語, Fortran言語共通) (hello-pure.bash, C言語, Fortran言語共通) ( P.26, ビデオ画像 )
- その他の注意事項 (その1) ( P.28, ビデオ画像 )
- その他の注意事項 (その2) ( P.29, ビデオ画像 )
- MPI実行時のリダイレクトについて ( P.30, ビデオ画像 )
3. 並列処理の評価指標 : 弱スケーリングと強スケーリング
- 弱スケーリング (Weak Scaling) ( P.32, ビデオ画像 )
- 強スケーリング (Strong Scaling) ( P.33, ビデオ画像 )
- 弱スケーリングと強スケーリング 適用アプリの特徴 ( P.34, ビデオ画像 )
- 強スケールアプリケーションの問題 ( P.35, ビデオ画像 )
4. ピュアMPIプログラム開発の基礎
- MPI並列化の大前提 (再確認) ( P.37, ビデオ画像 )
- 並列化の考え方 ( P.38, ビデオ画像 )
- 並列化の考え方 (Fortran言語) ( P.39, ビデオ画像 )
- 初心者が注意すること ( P.40, ビデオ画像 )
- 並列プログラム開発の指針 ( P.41, ビデオ画像 )
- 数値計算プログラムの特徴を利用し並列化がなされる ( P.42, ビデオ画像 )
- 並列化の方針の例 (C言語) ( P.43, ビデオ画像 )
- 並列化の方針の例 (Fortran言語) ( P.44, ビデオ画像 )
- データ分散方式に関する注意 ( P.45, ビデオ画像 )
- 並列化の方針 (行列-ベクトル積) (C言語) ( P.46, ビデオ画像 )
- 並列化の方針 (行列-ベクトル積) (Fortran言語) ( P.47, ビデオ画像 )
- 並列化の方針 (行列-ベクトル積) ( P.48, ビデオ画像 )
- 並列化の方針のまとめ ( P.49, ビデオ画像 )
- 行列 - ベクトル積のピュアMPI並列化の例 (C言語) ( P.50, ビデオ画像 )
- 行列 - ベクトル積のピュアMPI並列化の例 (Fortran言語) ( P.51, ビデオ画像 )
- nがMPIプロセス数で割り切れない時 ( P.52, ビデオ画像 )
- 余りが多い場合 ( P.53, ビデオ画像 )
5. ハイブリッドMPIプログラム開発の基礎
- 用語の説明 ( P.55, ビデオ画像 )
- ハイブリッドMPI実行の目的 ( P.56, ビデオ画像 )
- ハイブリッドMPI並列プログラムの開発の指針 ( P.57, ビデオ画像 )
- 行列 - ベクトル積のハイブリッドMPI並列化の例 (C言語) ( P.58, ビデオ画像 )
- 行列 - ベクトル積のハイブリッドMPI並列化の例(Fortran言語) ( P.59, ビデオ画像 )
- ハイブリッドMPI実行の注意点(その1) ( P.60, ビデオ画像 )
- ハイブリッドMPI実行の注意点(その2) ( P.61, ビデオ画像 )
- ハイブリッドMPI実行の注意点(その3) ( P.62, ビデオ画像 )
- ハイブリッドMPIの起動方法 ( P.63, ビデオ画像 )
- 数値計算ライブラリとハイブリッドMPI実行 ( P.64, ビデオ画像 )
- スレッド並列版BLAS利用の注意 ( P.65, ビデオ画像 )
- 逐次BLASをスレッド並列化して呼び出す例 ( P.66, ビデオ画像 )
- <スレッド並列版BLAS>と<逐次BLASを上位のループでスレッド並列呼び出し>する時の性能例 ( P.67, ビデオ画像 )
- n=1000での性能(T2K(1ノード,16コア)) BLAS内でスレッド並列化する場合に対する速度向上 ( P.68, ビデオ画像 )
- ScaLAPACKにおけるハイブリッドMPI実行の効果の例 ( P.69, ビデオ画像 )
- コンパイラの最適化の影響 (その1) ( P.71, ビデオ画像 )
- コンパイラの最適化の影響 (その2) ( P.72, ビデオ画像 )
- ハイブリッドMPIプログラミングのまとめ ( P.73, ビデオ画像 )