高温個所をシミュレート――空気力学を駆使したデータセンターの熱対策、センター構築時だけでなく継続的な再計算が必要

 インディアナ州ジェファーソンビル市でITディレクターを務めるロジャー・ハーディ氏は、今月のとある日、同市データセンターの空調システムがダウンしたというアラートを自動監視システムから受け取った。同氏はすぐさまデータセンターに駆けつけたが、コンピュータ・ルームの温度が「デスポイント」(同氏)に達するのを防ぐために残された時間は20分しかなく、結局は2万ドル相当のIT機器を失った。

 ジェファーソンビル市は今月になって温かい気候が続き、同データセンターの空調システムは常にフル稼働中だった。そうしたなか、空調システムのダウンによってコンピュータ・ルームの温度は設定値よりも上昇し、IT機器が壊れるとされている約33℃に達したという。

 約2万9,000人の人口を持つジェファーソンビル市の唯一のIT担当者であるハーディ氏は、空調システムを増強するために予算の承認を得ようとしていた矢先だった。同氏は、昨年12月に現在の職に就いたとき、こうした問題は予想だにしなかった。同市はデータセンターを昨年建設したばかりだったからだ。

 ハーディ氏の前任者は、データセンター建設プロジェクトのごく初期の段階で死去していた。その後のデータセンター建設にかかわる意思決定は、将来の冷却ニーズを考慮に入れたものではなかったと、ハーディ氏は語る。同氏は、採用された後で初めて、本来必要な冷却能力のごく一部しか確保されていないことに気づいたという。

複雑な空気の流れをシミュレート

 ジェファーソンビル市で起きたような不測のトラブルに備えるため、データセンター内の空気の流れをシミュレーションする企業が増えている。これは、自動車や航空機のメーカーが車体や機体の周囲の空気の流れを調べるために行う、空気力学(流体力学)によるシミュレーションと似たものだ。

 冷却空気がIT機器に豊富に供給されていても、機器が適切に配置されていないと、過熱の問題が発生するおそれがある。特にブレード・サーバのような高密度システムは、空気の流れに影響されやすい。

 だが、空気の流れをシミュレートするには15万ドルもかかる場合があると、ブランズパックの社長兼主席エンジニア、マーク・エバンコ氏は語る。同社は、データセンター・エンジニアリング/設計サービスの一環として、流体力学を基にコンピュータ・ルームの空気の流れを調査するサービスを提供している。

 エバンコ氏によると、こうした調査はきわめて複雑だという。シミュレーション用のデータを集めるには、ラックごとにデータを調べ、データセンター内の空気の流れをあらゆる面から確認しなければならない。さらに、データセンターの将来的な構成変更も考慮に入れる必要があるからだ。

効果は最初の段階のみ

 空気力学を駆使したデータセンターの熱シミュレーションに疑問符を付ける専門家もいる。Intelのデータセンター・オペレーション・マネジャー、ジョン・ムジリ氏がそうだ。「空気の流れが図に示されると、最初は熱対策がうまくいくように思える。だが結局、役に立つのは最初の段階だけだ」と同氏は語る。

 データセンター管理者の団体であるAFCOMのシンクタンク「Data Center Institute」に所属するムジリ氏は、ユーザーがデータセンターに機器を増設したり、システムをあちこちに移動したりするようになると、シミュレーションで作成されたモデルに合わない空気の流れが生じると指摘する。

 Intelも自社データセンターの熱対策に空気のシミュレーション・モデルを取り入れているが、それはあくまで1つのツールにすぎないと、ムジリ氏は語る。「シミュレーション・モデルにより、確かに大きな問題が起こるかどうかがわかる。だが、綿密に調査すると、さほど重大ではない問題が検出されることもある」(同氏)

 一方、サーバの熱関連の問題については、ほかのトラブルを誘発していることが明らかな場合もあれば、そうでない場合もある。例えば、たまに発生するディスク・ドライブの障害は、必ずしもデータセンターの局所的な発熱によるものとは言い切れない。どちらかと言えば、機械的な問題に起因していることのほうが多い。

 だが、アップタイム・インスティチュートのエンジニア兼コンサルタント、ボブ・サリバン氏は、IT機器の問題の多くは過熱が原因だと考えている。「過熱の問題は、人々が考えている以上に大きい」と同氏は指摘する。

 アップタイム・インスティチュートが30カ所のコンピュータ・ルーム(総面積2.8ヘクタール)を調査したところ、平均して10%のサーバ・キャビネットに25℃以上の高熱部があることが判明したという。

 サリバン氏は、IT機器の温度を定期的にチェックし、上昇時には適切な対応策を講じることで、過熱の問題をかなり管理できるとアドバイスする。

 メトリクス・ベースト・アセスメンツのコンサルタント、マーク・レビン氏も、IT機器のチェックを欠かさないことが熱問題の解決に有効だと強調する。「データセンターに頻繁に足を踏み入れ、その中を注意深く調べていけば、高温個所がどこにあるのかがわかる」と同氏は語る。

 空調システムのダウンによりIT機器の一部を失ったジェファーソンビル市では、データセンターの冷却能力を2カ月以内に倍増させる予定だ。しかし、それでもハーディ氏の表情はさえない。冷却設備が増強されるまでは、気が抜けない日が続くからだ。「しばらくは苦労が続き、何日かは深夜残業も必要になるだろう」(同氏)

(パトリック・ティボドー/Computerworld オンライン米国版)

提供:Computerworld.jp