東北大学 東北メディカル・メガバンク機構、DDNの国内最大規模 50PBの高速大容量ストレージシステムを導入し、ゲノム医学研究をさらに加速

株式会社データダイレクト・ネットワークス・ジャパン(所在地:東京都千代田区、代表取締役:ロベルト・トリンドル、以下 DDN)は本日、東北大学 東北メディカル・メガバンク機構(所在地:宮城県仙台市、機構長:山本 雅之)が運用するスーパーコンピュータのPhase 3システムに採用されたDDNストレージソリューションについての導入事例を発表しました。

詳細URL: https://ddn.co.jp/media/2023/04/25/283

画像1: https://www.atpress.ne.jp/releases/353346/LL_img_353346_1.jpg
東北大学 東北メディカル・メガバンク機構 事例

東北大学 東北メディカル・メガバンク機構は、2012年2月に、未来型医療を築いて東日本大震災の復興に取り組むために設置され、被災地の地域医療再建と健康支援に取り組みながら、医療情報とゲノム情報を複合させたバイオバンクを構築しています。その要となるスーパーコンピュータシステムはすでに2014年にPhase 1、2018年にPhase 2と更新され、国内でも有数の大規模ゲノム解析を実施していました。

東北メディカル・メガバンク機構が運用するスーパーコンピュータシステムはヒト全ゲノム解析やメタボローム解析、脳画像解析などさまざまな用途に使われていますが、中でもリソースを必要とするのがヒト全ゲノム解析でした。ゲノム解析には、演算性能だけでなく、多量のストレージが要求され、大規模ゲノムコホート調査では、15万人という日本最大規模のゲノム解析を行うために、生のゲノムデータだけでも1人あたり1TBにもなるため、Phase 2システムで拡充したストレージシステムでも容量が足りなくなってきていました。そのため、東北メディカル・メガバンク機構ではさらなる大容量化と高性能化を求めて、再びスーパーコンピュータシステムの大規模更新に取り組み、Phase 3システムの構築を開始しました。

Phase 3のストレージシステムでは、DDN EXAScalerが約50PBで構成され、下記4点の目的を実現するべく導入されました。新システムで達成された項目は下記の4点です。

●限られた予算の中でシステムを更新し、セキュリティと利便性、パフォーマンスのすべてのバランスが取れたシステムを実現
●大規模ゲノムコホート調査の要となるストレージは、Phase 2システムに引き続きDDNストレージを中心に構成し、合計60PBという大容量を実現
●データ使用量の大きいユニット間のストレージ容量の配分を柔軟にできるシステムを構築
●ハードリンクとサブディレクトリマウントを活用することで、データをコピーせずに各ユニットからデータにアクセスできるストレージシステムを構築

2022年4月にから本番稼働を開始したPhase 3のスーパーコンピュータシステムですが、DDNのストレージソリューションは、安定した稼働を続けています。システム更新の責任者であり、東北メディカル・メガバンク機構 副機構長、ゲノムプラットフォーム連携センター長の木下 賢吾 教授は下記のように述べています。

「東北メディカル・メガバンク機構では、Phase 1システムからPhase 3システムまで継続してDDNのストレージを使い続けていますが、一度もデータロスがなく、高い信頼性を担保していると認識しています。スパコンとはインフラであり、動いて当たり前で、切り替える時にもユーザーに気づかれないのが理想ですが、それはなかなか難しい。サステナビリティを大規模のシステムで実現するのはどうすればいいかというのが今後のチャレンジです。また、一般論としてベンダー側に期待したいのは、システムの安定性です。しかし安定性を誤って解釈し、同じモノを常に維持し続けることだと思っていると、陳腐化してしまいます。そのため、常にチャレンジと安定性のバランスを取るということが非常に重要です。
技術力を保ちつつ、開発をしながら、バグが発生したときにはすぐに対応できる技術者も揃えておく。それをきちんと理解して成長していくようなベンダーと今後もお付き合いして、最先端のシステムを検討していきたいと考えています」

画像2: https://www.atpress.ne.jp/releases/353346/LL_img_353346_2.jpg
東北メディカル・メガバンク機構 副機構長 ゲノムプラットフォーム連携センター長 木下 賢吾 教授

今回の事例はこちら( https://ddn.co.jp/media/2023/04/24/283 )からご覧いただけます。

画像3: https://www.atpress.ne.jp/releases/353346/LL_img_353346_3.jpg
システム構成図

■データダイレクト・ネットワークス(DDN)について
データダイレクト・ネットワークス (英語表記DataDirect Networks、以下 DDN)は、インテリジェント・インフラストラクチャを実現する人工知能(AI)とデータ管理ソフトウェアおよびハードウェア・ソリューションのグローバルリーダーとして、データ集約型のグローバル企業のビジネス課題を解決するための統合分析を提供しています。DDNは、過去20年以上にわたり10,000社以上の企業、政府機関、公共部門の顧客に選ばれるデータ管理プロバイダーとしての地位をグローバルに確立してきました。
TintriはDDNの完全子会社で、IntelliFlash、Nexenta、およびTintriのテクノロジーで構成され、リアルタイムで予測可能なアプリケーション分析を促進するインテリジェント・インフラストラクチャのイノベーションによって、オンプレミスおよびマルチクラウド環境のシンプルさ、効率性、俊敏性を実現し、企業顧客に高いユーザー体験を提供しています。
株式会社データダイレクト・ネットワークス・ジャパンはDDNの日本法人・100%子会社です。
https://ddn.co.jp/

詳細はこちら
プレスリリース提供元:@Press
東北メディカル・メガバンク機構 副機構長 ゲノムプラットフォーム連携センター長 木下 賢吾 教授 システム構成図