ASAP Top


Multi-GPU system with ExpEther

ExpEtherという仮想化技術により、ホスト(CPU)と複数のデバイス(GPU)を10Gb Ethernetで接続するシステムである (以下、Express system)。

ExpEtherではPCIeのパケットをEthernetのフレームにカプセル化するということを行っている。 そのため、このシステムのユーザからはホストのマザーボードに直接GPUが挿さっているように見える。

GPU-BOXはこれのプロトタイプで、8個のExpEther NICと3000Wの電源が付いた箱のこと。 最大8台のGPUを搭載することができる。

このGPU-BOXは、2013年度卒の野村先輩(通称のむさん)から脈々と実機評価@NECで使われていた。 しかし、2015年2月から市販品のExpEther I/O拡張ユニット (N8000-1005) が使われるようになる。 基本的には入れ物が変わっただけで、ExpEther NICに変化は無いため、性能に差はない。

このシステムの売りは主に拡張性にある。 ExpEther I/O拡張ユニットをEthernet switchにつなぐだけでGPUの増設が簡単に行えるからである。 「この拡張性が既存のデータセンタに光をもたらす」とか云々言って論文のIntroductionが始まるのである。

実機環境

これまでにやってきたこと

一般的なシングルホストマルチGPUシステム (Common system) との違い

ここでいうCommon systemとは、1つのマザーボードのPCIeスロットに複数のGPUが付いているシステムのことを指す。

基本的にCommon systemでできることはExpress systemでもできる。 つまり、Common systemのコードがそのままExpress systemでも利用でき、正しく動くということ。

ただし、利用できるからといって実際に使い物になるとは限らない。 PCIeの帯域幅と10Gb Ethernetの帯域幅に大きな差があるためである。

このことを考慮していないコードが性能的に使い物にならないということは容易に想像がつくだろう。

Express systemを使うときの注意事項

覚えておくと便利なコマンド

参考

written by mits(2015-02-14)


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS