HPC・GPU
お手持ちの数値計算ソフトウェアのパフォーマンスに満足されていますか?
コンピュータのマルチコア化、クラスタの普及、およびクラウドサービスの展開により、従来よりも並列計算が身近なものになってきています。
また、スーパーコンピュータの利用を考えた場合も、並列計算への対応が欠かせません。
最近では、GPGPU も一般的になっています。これらの技術を元に「より早い計算」を実現するためのサポートを行っております。
OpenMP/MPI
GPU
HPC
並列計算シミュレーションフレームワーク
並列計算シミュレーションフレームワークを作成しました。これは、解析モデルの連成シミュレーションをおこなうための、ライブラリと実行モジュールのセットです。 実装は、C++ + OpenMP + OpenMPI / IntelMPI です。スーパーコンピュータへの対応もしています。 また、既存プログラムの OpenMP / MPI を用いた並列化対応のご依頼や、GPGPU での高速化などのご依頼も承っています。
GPU
行列ソルバの高速化
容量計算モジュール CARP に搭載されている疎行列反復法ソルバを GPGPU 並列化しました。
弊社で作成した CUDA カーネルコードで反復法の行列ベクトル積を既存ライブラリよりも高速化し、シングルコア版に比べて 13 倍の高速化を実現しました。
なお、上記の計算に用いた環境は、以下の通りです。
- CPU: Intel Xeon E5-2667v2 3.30GHz (8C/16T x 2 = 32 threads)
- GPU: NVIDIA GTX TITAN BLACK 6GB
- CUDA 8.0
![]() |
GPU アクセラレータによる疎行列ソルバの高速化 |