FICmeeting181109
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
[[ASAP Top]]
-山倉
--3×3スイッチの設計時間とコンフィギュレーション時間の評価
---4×4がすぐにできるので評価をとる(畔上さんからもらう、PR...
---5×5とかも(9×9まで、卒論はどこのあたりから領域が小さく...
--PR領域が小さい(無駄が多いように見える)問題
---調べる(Warningを解析する→ふんがさんに相談)
---BRAMとDSPをもっと使えるようにしたい
--CPSY(1月)
-山内さん
--プロポーザル
--一つのアプリでスケーラビリティ
---アプリの選定(推論 or ビデオ圧縮)
--Cool Chips、Reconfig(来年の12月)、離島
-飯塚さん
--プロポーザルの質疑応答
---モジュールは動的なのか、どのようなモジュールをどれだけ...
---CPU,GPUでやった場合と比べてどれくらい速くなるかという...
1枚での比較は多いけどマルチでやっても電力性能がスケールす...
--プロポを終えて
---VS一つのハイスペックなFPGA、VS GPU
--アクションアイテム
---モジュール呼び出し(ONNXから何の計算するか、サイズ、重...
---ハードウェア実装(なにかモデルを載せて通信して計算)
---モジュール割り付け
--学会
---離島、Cool Chips
-ひかりさん
--FPGAでの学習アクセラレータのフレームワーク
--Roadmap
---RNNの推論を複数のFICボードで動かす
---簡単なRNNの学習
---コンフィギュレーション
---JSON configをハードウェアに
-武者さん
--デザインガイア2018完
---FiCSW1 17.89W(= 12.87V×1.39A)(BRAM 80%, DSP 80%, FF,LU...
--全結合層
---6.87GOPS/W (1枚→4枚)
--ジャーナル(11月末) or 国際学会(FPL締め切り3月)→デザイン...
--DRAM
-畔上さん
--連続転送テスト
--ネットワーク
--ジャーナル
--9×9まで評価をとる
--バリア同期
-Imdadさん
--Genome Sequencing(A,C,T,Gが2billionあるが各人で98%同じ)
---1)out/delete
---2)In
---3)Mismatch
--BWT(Burrows Wheeler Transform)をまずシングルFPGAで、次...
-Akramさん
--Axi4
--memcpy(DDR4, hls, size);
--memcpy(hls, ddr, size);
--32×128bit data
終了行:
[[ASAP Top]]
-山倉
--3×3スイッチの設計時間とコンフィギュレーション時間の評価
---4×4がすぐにできるので評価をとる(畔上さんからもらう、PR...
---5×5とかも(9×9まで、卒論はどこのあたりから領域が小さく...
--PR領域が小さい(無駄が多いように見える)問題
---調べる(Warningを解析する→ふんがさんに相談)
---BRAMとDSPをもっと使えるようにしたい
--CPSY(1月)
-山内さん
--プロポーザル
--一つのアプリでスケーラビリティ
---アプリの選定(推論 or ビデオ圧縮)
--Cool Chips、Reconfig(来年の12月)、離島
-飯塚さん
--プロポーザルの質疑応答
---モジュールは動的なのか、どのようなモジュールをどれだけ...
---CPU,GPUでやった場合と比べてどれくらい速くなるかという...
1枚での比較は多いけどマルチでやっても電力性能がスケールす...
--プロポを終えて
---VS一つのハイスペックなFPGA、VS GPU
--アクションアイテム
---モジュール呼び出し(ONNXから何の計算するか、サイズ、重...
---ハードウェア実装(なにかモデルを載せて通信して計算)
---モジュール割り付け
--学会
---離島、Cool Chips
-ひかりさん
--FPGAでの学習アクセラレータのフレームワーク
--Roadmap
---RNNの推論を複数のFICボードで動かす
---簡単なRNNの学習
---コンフィギュレーション
---JSON configをハードウェアに
-武者さん
--デザインガイア2018完
---FiCSW1 17.89W(= 12.87V×1.39A)(BRAM 80%, DSP 80%, FF,LU...
--全結合層
---6.87GOPS/W (1枚→4枚)
--ジャーナル(11月末) or 国際学会(FPL締め切り3月)→デザイン...
--DRAM
-畔上さん
--連続転送テスト
--ネットワーク
--ジャーナル
--9×9まで評価をとる
--バリア同期
-Imdadさん
--Genome Sequencing(A,C,T,Gが2billionあるが各人で98%同じ)
---1)out/delete
---2)In
---3)Mismatch
--BWT(Burrows Wheeler Transform)をまずシングルFPGAで、次...
-Akramさん
--Axi4
--memcpy(DDR4, hls, size);
--memcpy(hls, ddr, size);
--32×128bit data
ページ名: