現在位置: ホーム 研究支援 アプリ開発支援 アプリ公開の手引 アプリの作成 アプリの並列化 Hybrid並列化技法(MPIとOpenMPの応用)

Hybrid並列化技法(MPIとOpenMPの応用)

作者: admin — 最終変更 2014年07月29日 14時34分
2013年前期に行われたCMSI計算科学技術特論Aの講義「第4回 Hybrid並列化技法(MPIとOpenMPの応用)」をもとに、Hybrid並列化技法に関して解説しています。

(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。

 


1. 実際の並列計算機構成例

  • 東京大学情報基盤センタースパコン T2Kオープンスパコン (東大版) (HA8000クラスタシステム) ( P.4, ビデオ画像 )
  • T2K (東大) での全体メモリ構成図 ( P.6, ビデオ画像 )
  • 東京大学情報基盤センタースパコン FX10スーパーコンピュータシステム ( P.8, ビデオ画像 )
  • FX10の通信簿 (1TOFU単位) ( P.10, ビデオ画像 )
  • FX10の通信簿 (1TOFU単位間の結合) ( P.11, ビデオ画像 )

 

 


2. バッチ処理とMPIジョブの投入

  • FX10スーパーコンピュータシステムでのジョブ実行形態の例 ( P.13, ビデオ画像 )
  • バッチ処理とは ( P.14, ビデオ画像 )
  • コンパイラの種類とインタラクティブ実行およびバッチ実行の例 (FX10) ( P.15, ビデオ画像 )
  • バッチキューの設定の仕方 (FX10の例) ( P.16, ビデオ画像 )
  • インタラクティブ実行のやり方の例 (FX10スーパーコンピュータシステム) ( P.17, ビデオ画像 )
  • pjstat --rsc の実行画面例 ( P.18, ビデオ画像 )
  • pjstat --rsc -x の実行画面例 ( P.19, ビデオ画像 )
  • pjstat --rsc -b の実行画面例 ( P.20, ビデオ画像 )
  • JOBスクリプトサンプルの説明 (ピュアMPI) (hello-pure.bash, C言語, Fortran言語共通) ( P.21, ビデオ画像 )
  • 並列版Helloプログラムを実行しよう (ピュアMPI) ( P.23, ビデオ画像 )
  • バッチジョブ実行による標準出力、標準エラー出力 ( P.24, ビデオ画像 )
  • 並列版Helloプログラムを実行しよう (ハイブリッドMPI) ( P.25, ビデオ画像 )
  • JOBスクリプトサンプルの説明 (ハイブリッドMPI) (hello-hy16.bash, C言語, Fortran言語共通) (hello-pure.bash, C言語, Fortran言語共通) ( P.26, ビデオ画像 )
  • その他の注意事項 (その1) ( P.28, ビデオ画像 )
  • その他の注意事項 (その2) ( P.29, ビデオ画像 )
  • MPI実行時のリダイレクトについて ( P.30, ビデオ画像 )

 

 


3. 並列処理の評価指標 : 弱スケーリングと強スケーリング

  • 弱スケーリング (Weak Scaling) ( P.32, ビデオ画像 )
  • 強スケーリング (Strong Scaling) ( P.33, ビデオ画像 )
  • 弱スケーリングと強スケーリング 適用アプリの特徴 ( P.34, ビデオ画像 )
  • 強スケールアプリケーションの問題 ( P.35, ビデオ画像 )

 

 


4. ピュアMPIプログラム開発の基礎

 

 


5. ハイブリッドMPIプログラム開発の基礎

  • 用語の説明 ( P.55, ビデオ画像 )
  • ハイブリッドMPI実行の目的 ( P.56, ビデオ画像 )
  • ハイブリッドMPI並列プログラムの開発の指針 ( P.57, ビデオ画像 )
  • 行列 - ベクトル積のハイブリッドMPI並列化の例 (C言語) ( P.58, ビデオ画像 )
  • 行列 - ベクトル積のハイブリッドMPI並列化の例(Fortran言語) ( P.59, ビデオ画像 )
  • ハイブリッドMPI実行の注意点(その1) ( P.60, ビデオ画像 )
  • ハイブリッドMPI実行の注意点(その2) ( P.61, ビデオ画像 )
  • ハイブリッドMPI実行の注意点(その3) ( P.62, ビデオ画像 )
  • ハイブリッドMPIの起動方法 ( P.63, ビデオ画像 )
  • 数値計算ライブラリとハイブリッドMPI実行 ( P.64, ビデオ画像 )
  • スレッド並列版BLAS利用の注意 ( P.65, ビデオ画像 )
  • 逐次BLASをスレッド並列化して呼び出す例 ( P.66, ビデオ画像 )
  • <スレッド並列版BLAS>と<逐次BLASを上位のループでスレッド並列呼び出し>する時の性能例 ( P.67, ビデオ画像 )
  • n=1000での性能(T2K(1ノード,16コア)) BLAS内でスレッド並列化する場合に対する速度向上 ( P.68, ビデオ画像 )
  • ScaLAPACKにおけるハイブリッドMPI実行の効果の例 ( P.69, ビデオ画像 )
  • コンパイラの最適化の影響 (その1) ( P.71, ビデオ画像 )
  • コンパイラの最適化の影響 (その2) ( P.72, ビデオ画像 )
  • ハイブリッドMPIプログラミングのまとめ ( P.73, ビデオ画像 )