アプリケーションの性能最適化2(CPU単体性能最適化)
作者: admin
â
最終変更
2014年08月15日 17時56分
2014年前期に行われたCMSI計算科学技術特論Bの講義「第3回 アプリケーションの性能最適化2(CPU単体性能最適化)」の紹介をしています。
(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。
1. スレッド並列化
2. CPU単体性能を上げるための5つの要素
- CPU単体性能を上げるための5つの要素 ( P.9, ビデオ画像)
- (1)ロード・ストアの効率化 ( P.10, ビデオ画像)
- (2)ラインアクセスの有効利用 ( P.15, ビデオ画像)
- (3)キャッシュの有効利用 ( P.16, ビデオ画像)
- (4)効率の良い命令スケジューリング ( P.17, ビデオ画像)
- 並列処理と依存性の回避 ( P.18, ビデオ画像)
- (5)演算器の有効利用 ( P.22, ビデオ画像)
5. 具体的なテクニック
- スレッド並列化 ( P.36, ビデオ画像)
- CG法前処理のスレッド並列化 ( P.37, ビデオ画像)
- ロード・ストアの効率化 ( P.39, ビデオ画像)
- ラインアクセスの有効利用 ( P.44, ビデオ画像)
- キャッシュの有効利用 ( P.46, ビデオ画像)
- 効率の良いスケジューリング・演算器の有効利用 ( P.54, ビデオ画像)
- まとめ ( P.60, ビデオ画像)