線形代数演算ライブラリBLASとLAPACKの実践
作者: admin
â
最終変更
2014年07月29日 14時36分
2013年前期に行われたCMSI計算科学技術特論Aの講義「第7回 線形代数演算ライブラリBLASとLAPACKの基礎と実践2」をもとに、線形代数演算ライブラリの実践方法に関して解説しています。
(注) ビデオ画像の開始位置は、回線状況によりずれが生じる可能性があります。その場合は再読み込みを行ってください。
1. コンピュータの簡単な仕組みについて
- コンピュータの簡単な仕組み ( P.4, ビデオ画像 )
- CPUのスピードについて ( P.5, ビデオ画像 )
- メモリ(記憶装置)のスピードについて ( P.6, ビデオ画像 )
- CPUとメモリのスピード比の変化 ( P.7, ビデオ画像 )
2. GPUについての紹介
3. プログラムを速くするには?
4. 高速なBLAS LAPACKを使うには
- 高速なBLAS LAPACKを使う ( P.18, ビデオ画像 )
- FLOPS:マシンの性能の計り方のひとつ ( P.19, ビデオ画像 )
- Bytes per FLOPS ( P.20, ビデオ画像 )
- DGEMM 行列-行列積 ( P.21, ビデオ画像 )
- DGEMV : 行列ベクトル積 ( P.22, ビデオ画像 )
- 高速なBLAS、LAPACKの力を知る ( P.23, ビデオ画像 )
- 環境を整える ( P.24, ビデオ画像 )
- Reference BLASのDGEMM ( P.25, ビデオ画像 )
- Ubuntu標準ATLASの行列-行列積 ( P.26, ビデオ画像 )
- ATLASの行列-行列積 ( P.27, ビデオ画像 )
- GotoBLAS2の行列-行列積 ( P.28, ビデオ画像 )
- 高速なBLAS、LAPACKの力を知る: ( P.29, ビデオ画像 )
- DGEMVを使う ( P.30, ビデオ画像 )
- ここまでのまとめ ( P.36, ビデオ画像 )
5. 高速化の手法
- レジスタとアンローリング ( P.38, ビデオ画像 )
- キャッシュ ( P.39, ビデオ画像 )
- ブロック行列化 ( P.40, ビデオ画像 )
- cuBLAS+行列-行列積編 ( P.42, ビデオ画像 )
6. GPUでのBLAS(cuBLAS)
- GPUの使い方:GPUの弱点 ( P.44, ビデオ画像 )
- cuBLASとはなにか?(まずはBLAS) ( P.45, ビデオ画像 )
- cuBLASとは何か ( P.46, ビデオ画像 )
- cuBLASでの行列-行列積 ( P.47, ビデオ画像 )
- 難しい問題 ( P.54, ビデオ画像 )