2013年08月19日

データセンターの冷却はソフトウエア定義できるのか

最近ソフトウエア定義されるデータセンターが注目を浴びている。データセンターは周知のようにICTとファシリティの装置で成り立っている。しかし、現在のソフトウエア定義されるデータセンターにはファシリティの装置は含まれない。しかし、幾らICTの装置やそのレイアウトをソフトウエアで定義しても、その装置を問題なく動作させるためには、適度な冷却と電力が必要である。つまり、冷却と電力もソフトウエア定義されないと本当の意味ではデータセンターをソフトウエアで定義したことにはならない。このブログでは、冷却のソフトウエア定義に関して述べる。

冷却のソフトウエア定義を謳っているベンダーはあまり多くない。と言うか、筆者は一社しか知らない。それは、Vigilent社だ。早速知り合いのVigilent社のAlex Fielding氏に話を聞いた。

cooling-1.jpg

Alex Fielding氏

Vigilent社
非常に簡単に言うと、Vigilent社はデータセンター・インフラ管理(DCIM)のツールを提供するベンダーである。市場調査会社のGartnerはDCIMツールをを以下の様に定義している。 

データセンターの効率やエネルギー消費をモニター、計測、管理または制御する全てのIT関係の装置(サーバー、ストレッジ、ネットワークなど)やファシリティのインフラの要素(PDUやCRACなど)を含む。

Vigilent社の業務内容

Vigilent はDCIM のベンダーでデータセンターの冷却を管理する。非常に分かり易い。周知のようにデータセンターの運用は大部分はファシリティの人々によってなされる。IT関係の人たちはお客さんとして見られることが多い。しかも、なかなか要求の多い客だと思われがちだ。過去には何回もITとファシリティを統合し、データセンターを効率良く運用しようとする試みがなされた。幾分かの成功例はあるものの、統合管理というのはITとファシリティのどちらにも受け入れにくい提案の様だ。Fielding氏 によれば Vigilentの業績が良いのは2つの理由がある。1つはデータセンターの運用に大きな影響を与える部分を改善するからだ、つまり効率の高い冷却方法だ。40% から50% の冷却に必要な電力消費に影響を与えることができる。つまり、必要な所に必要な量の冷却を提供するのだ。だから、非常に恩恵が見えやすい。何かしなかればならないのはファシリティ側だけで、IT側のサーバーなどのIT機器にはタッチしない。しかし、そのおかげでIT側の人を巻き込む必要もなく、サーバーなどの装置に触れることもないが、IT装置を安定して問題なく運転することができる。ファシリティの人たちは簡単に理解でき、すぐに恩恵が見られるものであれば、非常に受け入れやすいという分けだ。その上、実際のインストレーションから数日でエネルギー効率の改善が見られるとFielding氏は続けた。

実装
Vigilentの技術を説明するのは容易だ。常にデータセンター内の冷却の必要性をモニターして計測し、本当に必要なところに動的に最少必要限の冷却を提供するということだ。サーバーやその他のIT 装置は負荷によって発熱量が異なる。データセンターの負荷は動的に時間毎や日ごとでも変化する。通常将来の拡張を見込んで、電力も冷却も過剰に準備しがちだ。IT装置は必要以上に冷却しすぎる必要はなく、冷却の必要性が軽減されれば冷却もそれに伴って調整されるべきだ。

Vigilentは正にその機能を提供する。一般的にデータセンターの冷却は冷却装置に戻ってくる熱くなった空気の温度を感知して温度調整を行う。しかし、本当に必要なのはサーバーの取り入れ口での空気の温度をモニターし温度調節をすることだ。これが行われなかったのは、以前は容易にサーバーの取り入れ口での空気の温度を測定できなかったからだ。ここ数年、サーバーやラックレベルでの温度や湿度などの環境情況をモニターし計測されるようになった。これを使用すれば、実際にモニター・計測しなければならない箇所で環境情況の情報を入手できるようになり、もっと効率の良い冷却を提供できるようになる。Vigilentは無線センサーを利用してDust Networks のメッシュ・ネットワークを利用して環境情報を収集する。常に温度などの環境情報を収集してモニターして、冷却装置を電源を入れたり、止めたり、またそのファンのスピードを調整することで、冷却量を調整することが出来る。以下の図はこの様子を示している。

cooling-2.jpg

Vigilentのシステムの仕組み (出典: Vigilent)

冷却の仮想化

Vigilentが最初に冷却の仮想化を言い出した。冷却の仮想化とは何だろう。あるものが仮想化されるのであれば、それを簡単さらに動的に生成、増量、除去、減量 および移動させることができる。これはサーバーの仮想化に当てはめてみると良く分かる。

冷却は:
生成される (冷却装置の電源をオンにする)
増量される(更に他の冷却装置の電源をオンにするまたは、ファンのスピードを増加する、チラーの温度を下げる)
除去される(冷却装置を停止を停止したり、スリープ・モードにする)
減量される(冷却装置の一部を停止したり、ファンのスピードを下げたり、チラーの温度を上げる)

移動はどうだろう。冷却って動的に移動できるのだろうか。実際のところ、仮想化されたサーバーも物理的に移動されるわけではない。vMotionの様にバーチャル・マシン(VM)の移動は生成、コピーと除去で実装されている。その仕組みは、新しいVM のインスタンスが移動先のサーバーに生成される、実行状態を元のVMのインスタンスからこのインスタンスにコピーする、そして最後にもとのインスタンスを除去する。この手法は冷却にも適用できる。サーバーのVMが1つのサーバーから他のサーバーに移動されると、当然移動元と移動先のサーバーに対する冷却の要求は変化する。移動元用のサーバーに対する冷却は停止されるか、冷却量を削減できる。これに反して、移動先のサーバーは冷却要求が増加して、移動先用のために新たな冷却のインスタンスを生成することで対応できる。

当然サーバーと冷却ではインスタンスの移動は全く同じではない。冷却のインスタンスはサーバーのVMの様に、移動元と移動先では全く同じコピーではない。物理的なレイアウトなどの幾つかのファクターにより、移動元と移動先では冷却量でさえ異なるかも知れない。しかし、これは移動元から移動先に動的に冷却が移動したと言えるだろう。ということで、冷却はIT機器の様に仮想化されると言う事にする。

以前に述べた電力の仮想化と共に、ソフトウエア定義されるデータセンターが新しく定義される。これによって、データセンターのコンフィギュレーションや要求をソフトウエアで定義すれば自動的にデータセンターを設計したり、最適な運用形態を自動的に生成することができる。これを敷衍すれば、ビルのエネルギー管理にも適用できるだろう。
posted by infogreen at 09:56| Comment(0) | ICTとエネルギー

2013年08月07日

データセンターに於けるソフトウエア定義の電力とは--その2

その1ではデータセンターに関する電力不足と電力料金に関して述べた。結論は消費者としては、電力の供給はコントロールできないので、需要をコントロールするしかない。供給電力が十分でないときや他のデータセンターでの電力料金が安い場合時、現在のデータセンターで負荷を削減するということだ。電力の削減は負荷削減、負荷使用時移動や負荷移動で対応できる。

ソフトウエア定義できる要素

最近ソフトウエア定義されるデータセンター(SDDC)やソフトウエア定義されるネットワーク(SDN)が脚光を浴びており、「ソフトウエアで定義できるなになに」は「なになにをサービスで提供する、software as a」の様に注目を浴びている。サーバー、ストレッジやネットワーク装置の仮想化は異なったペースで進んでいる。(DatacenterDynamics社のYevgeniy Sverdlik氏記事を参照のこと ページ52.) 以前のブログでは冷却も仮想化できると述べた。(これは英語のみ、そのうち日本語化)。

では仮想化するのに残った要素は電力だ。電力は仮想化できるのだろうか。電力の仮想化やソフトウエア定義の電力をGoogle検索して見た。Wikipediaに載っているのではないかと期待したが、代わりにPower Assure社の Clemens Pfeiffer 氏の記事や彼のコメントばかりを見つけた。こうなったら、彼をインタビューしてソフトウエア定義の電力とはなにか確かめよう。

Power Assure社が説明するソフトウエア定義の電力

以下はPfeiffer 氏との会話をまとめたものである。 (ソフトウエア定義の電力の詳細は彼の記事を参照のこと。)

pa-sdp-1.jpg
Clemens Pfeiffer氏

データセンターでの主な要素はなんだろうか。それは、IT (サーバー、ストレッジとネットワーク機器) とファシリティ (冷却と電力装置)だ。この5つの内どれが簡単に仮想化(ソフトウエアで定義)されるだろうか。仮想化できるためには、物理的な物が比較的容易に抽象化されることである。仮想化されるとIT機器は抽象化されそのインスタンスが容易に生成、増加、移動、減少そして除去される。冷却はIT機器の様には抽象化されないが、冷却機器の運転を開始したり停止したり、ファンのスピード を調整したら、チラーの温度を調節することで抽象化することができる。

つまり、電力を除く4つの要素は抽象化できるのでソフトウエアで定義・規定できる。

電力はソフトウエアで定義できるのだろうか

Pfeiffer氏は電力はユニークな要素だと言い、以下の図を描いて(上の写真にも写っている)説明した。データセンターの存在理由はビジネスの目的を達成するためのアプリケーションを実行することである。アプリケーションを安定に実行することが一番重要なことである。アプリケーションは4つの要素に支えられている。つまり、サーバー、ストレッジ、ネットワークと冷却だ。そしてこの4つの要素は電力なしでは動作しない。次の絵でこの状況を表している。

pa-sdp-2.gif

アプリケーションはサーバー、ストレッジ、ネットワークと冷却に支えられている。そして今度は、それぞれは電力に支えられている。 (出典: Power Assure)

こう考えると電力がデータセンターで一番重要な要素だということになる。冷却を仮想化することができるなら、電力も仮想化できるのだろうか。Pfeiffer氏は必ずしもそうではないと言う。

ソフトウエア定義の電力

ソフトウエア定義の電力 (SDP: software defined power) はITや冷却と同じようには仮想化できない。Pfeiffer氏と議論し、Power Assureの資料を精査して、以下のような結論に達した。 SDPはデータセンターで負荷を制御し、電力事情や料金を考慮して他のデータセンターに負荷を移動する方法である。この複雑な決定やプロセスをソフトウエアで行うということだ。つまり、負荷(電力)を分散をソフトウエアによって定義・規定される ということだ。

それでは、その1で述べた仮想化またはソフトウエアによる定義・規定のテストを電力に適用してみよう。つまり、なにかがソフトウエアで定義・規定できるのなら、それは容易で動的に生成、除去および移動できるはずだ。まず指摘しておきたいのは、電力に対しては直接なにもできないことだ。生成も除去も移動も必要に応じて動的には何もできない。これは、ITや冷却装置の仮想化とは大きく異なる。電力以外のリソースはそれぞれの仮想化されたインスタンスを直接生成することができる。言い換えれば、物理的なリソースは既に存在するがその仮想化されたインスタンスは活性化しなければ存在しない。活性化された後のみに、仮想化インスタンスが存在する。

これに対して、容量に上限はあるが、電力は既に仮想化された物である。常に存在し、電力エネルギーとして割り当てられている。しかし、サーバーのインスタンスとは異なり、装置の電源がオンにならなければなにもしない。装置がオンになれば、割り当てられている電力の一部が活性化されその装置の動力源となる。生成と消費を同じものとすれば、生成テストはパスする。つまり、割り当ての電力の中から、必要な量の電力インスタンスが活性化され、その装置を稼動する。その電力インスタンスは装置が稼動し続ける限り活性化されたままである。増加テストも、もっと装置が稼動されると、それに見合う電力インスタンスが活性化されると説明できる。

同様に。除去のテストもパスする。ある装置の電源を切ると、その装置の動力源となっていた電力インスタンスは除去される。量の削減も同様に問題なく説明される。しかし、移動のテストはそううまくは行かない。同じフィーダーや回路内では、移動のテストは問題ない。しかし、異なったセクションで別々のフィーダーや回路で電力を供給されている場合は、テストには失敗する。2つのセクションAとBを考えて見よう。セクションBで電力が不足し、セクションAには電力に余裕があっても、AからBに電力を移動できるのだろうか。これは可能ではない。それぞれののセクションでは予め電力の容量が規定されており、それ以上の電力を動的に増加はできない。

しかし、移動をデータセンター間に応用すれば移動テストはパスする。同じデータセンター内ではあるセクションから違うセクションに電力を移動はできない。しかし、1つのデータセンターから負荷を他のデータセンターに移動するとどうなるか。負荷が削減されたため、もとのデータセンターでは電力消費量が削減され、移動先のデータセンターでは電力消費量が増加する。これは、もとのデータセンターから移動先のデータセンターに電力が移動したことと同様に考えることができる。

SDP の実装の方法はどうするのか

Power Assure が提唱しているのはデータセンターで電力需要を制御することだ。Pfeiffer氏は電力制御というのは、実際は負荷制御だと強調した。それ以外に電力制御はできない。デマンド・リスポンス(DR)は負荷を制御する方法だ。電力会社は可能な供給量の上限に需要が近づきつつある時、消費者に電力使用を削減するように依頼の信号を起こる。

現在までデータセンターにデマンド・リスポンス(DR)を適用する話は聞いたことがなかった。データセンターにDRを適用したケースを述べたレポートによると、3つの方法で電力削減を図ることができる。それは、負荷削減、負荷時間帯の移動と負荷の移動だ。 負荷削減は単純に幾つかの装置の電源を落とし電力消費を削減する方法だ。そして、負荷時間帯の移動はピーク時などの決められた時間帯に使用する装置を他の時間帯で稼動することである。その結果、決められた時間帯での電力消費が削減される。どちらの方法も電力削減の方法としては有益であり、比較的簡単な方法で手動でも可能だ。負荷移動は1つのデータセンターから別のデータセンターに負荷を移動することだ。これが以下の図の示される様にPower Assureが主張する方法だ。

pa-sdp-3.gif

電力事情と安価な料金を利用するため、1つのデータセンターから別のデータセンターに負荷移動を行う。(出典: Power Assure)

負荷移動は電力が不足したり、ピーク時間や特別ピーク日などの、電力料金が高騰するときに適している。電力不足の場合、負荷移動は電力会社からのデマンド・レスポンスの信号がトリガーになる。高騰する電力料金に対しては、データセンターが存在する地域の電力料金情報をリアルタイムで入手できることが必要となる。これには、負荷移動には様々な決定やプロセスが必要である。Power Assureはこれをソフトウエアで行うシステムを開発した。それは、ダッシュボード、オートメーションと電力料金へのアクセスから成り立つ。

負荷移動は容易ではない。以下の条件が必要だ。
*基本的なインフラ
*相互運用可能なメカニズム
*オートメーション
*電力料金へのアクセス


基本的なインフラ

インフラに対する仮定はデータセンター運用者が地理的に異なった場所に複数個のデータセンターを運用していることだ。そして、それぞれのデータセンターがディザスター・リカバリーかそれに似たシステムを設置していることだ。負荷移動はディザスター・リカバリーのインフラを利用できる。それは、既にデータセンター間はネットワークで接続されているからだ。大手のデータセンター運用者はディザスター・リカバリーのシステムを設置しており、この仮定は無理なものではない。

相互運用可能性

負荷移動に関しては、データセンター間が相互運用可能であることが理想的だ。しかし、同じ運営者であっても、それぞれのデータセンターは技術、データ形式、プロトコルや運用方法が異なっていることが多い。Power Assure ははこの違いを吸収する方法を開発したのだ(PA SDP )。この解でサポートされているシステムや技術は以下の図で示される。

pa-sdp-4.png

PA SDPでサポートされているシステムと技術 (出典: Power Assure社)


オートメーション

負荷移動は多くの複雑で面倒なステップから成り立っており、なんらかのオートメーションが必要だ。通常データセンター内の運転環境はユニークで互いに異なることが多い。その場合、 PA SDP はその差異を吸収して負荷移動を容易にする。 PA SDPのダッシュボードはこの全体の流れを表示することができる。

電力料金へのアクセス
電力料金は地域毎に異なり、電力会社毎にも異なる。一日の内の異なった時間でも変動する。現時点で一番安価の電力を確保するには、全米や全世界の電力料金へのアクセスが必須である。PA SDP は電力料金へのアクセスも含んでいる。

この2回に渡るブログで電力に関する問題を議論し、その1つの解としてソフトウエア定義の電力の実装について述べた。しかし、ここでの議論はまだ詳細を省略しており、将来的にもっと詳細について発表していく予定だ。
posted by infogreen at 04:56| Comment(0) | ICTとエネルギー

2013年08月06日

データセンターに於けるソフトウエア定義の電力とは--その1

この題目はITと電力との接点にあたり、とても興味深い。ITは完全に電力に依存しており、IT屋であっても電力を意識することが必要となってきた。 しかし、逆にITが電力をコントロールできるようになれば、非常に興味深く素晴らしい。この2回のブログの1回目はデーターセンタにおける電力の問題について述べる。それには電力の価格についての議論も含む。またこれは、2回目のソフトウエア定義の電力の実装に対する準備も兼ねている。ソフトウエア定義の電力を用いれば、データセンターに於ける諸問題を解決できるのだろうか。

電力不足の問題
データセンターでは電力問題が増加している。典型的な問題は電力不足だ。電力不足が起こるのは以下のような場合だ。

1. 電力会社に十分な電力供給能力がない。
2. 自分の電力システムのコンフィギュレーションが規定されており、容易に改善して電力容量を増加できない。


1の場合に関しては、更に2つの場合が考えられる。まず自分の立地地域で電力需要が増加して電力会社が十分な電力供給が出来ない場合だ。この場合、電力会社は送電システム、変電所を含む配電網を改善して整備しなければならない。これには、多額の費用と時間が必要である。更に、電力会社は大抵の場合は十分な電力供給能力があるが、一時的に需要が増大するとき、例えばピーク時間帯などだ。

2の場合に関しては、自分のデータセンターに与えられている電力は制限されおり、それを越えた電力を消費は出来ない。データセンターの電力容量やコンフィギュレーションは固定されており、実際にこれを変更しなければならない。この変更は自分のデータセンターに限らないことが通常だ。データセンターに電力を提供する電力会社はそれに属する変電所やトランスなどを含めた配電網を整備する必要がある。場合によっては、送電網も改善する必要がある。この改善のの費用は当然データセンター側にも跳ね返る。

更に言うと、自分のデータセンターの電力コンフィギュレーションはデータセンター全体だけではなく、そのそれぞれのセクションでも同じだ。あるセクションにもっとIT装置をを追加したいとする。しかし、そのセクションに十分な電力が割り当てられていないと、そのPDUのブレーカーが飛んで電気が落ちてしまう。 ラックに十分なスペースがあっても、IT装置の追加はできない。つまり、使用不可能なスペースが生じることになる。この場合、装置場所を考慮する必要がある。そして、装置を移動する場合それぞれの装置をシャットダウン、 電源を落とし、電源やネットワークの回線を外し、移動して、再び電源とネットワークの回線を接続し、電源を入れて、ブートしなければならない。これは面倒なプロセスであり、ダウンタイムが生じて、ビジネスにも影響する。 もちろん、複数の装置を移動させる にはデータセンター全体の電力状況を把握して最良のICT装置のレイアウトを考えなければならない。これはなかなか困難なプロセスだ。

以上のそれぞれの場合について言えることは、電力需要の増加が恒常的ウであれば、変更することは正当化されるが、それが稀にしか起こらないのであれば、正当化するのは困難だ。

データセンターでの電力料金
現在は電力料金はデータセンターでは大きな問題となっている。IT屋だからと言って電力の問題を無視することはできなくなった。 データセンターでの電力料金は複雑で地域毎に異なる。更に、電力料金は様々な要素があり、それぞれの契約は独自なもので一般的な議論は困難だ。しかし、このブログのために詳細な議論は簡略化する。実際にはそれぞれのデータセンターの状況や、地域、電力会社によってかなり異なる。

大手のビジネスと産業の消費者用の料金体系には、大抵の電力料金は以下を含む:

*接続費 – 配電網に接続するため
*エネルギー費 – 消費されたエネルギーに対して (単位kWh)
*デマンド費または最大需要電力 – 最大の需要電力に対する料金 (単位kW)


接続費
一般的に多くの電力を必要とすると、電力会社は変電所を含む配電網を整備する必要がある。例えば50MWの電力が必要な場合は20MWの場合に比較して高い接続費を課せられる。

エネルギー費
エネルギー費はどれだけの電力を消費したかによって科せられる料金のことだ。これは消費者としてはよく知っている料金だ。使えば使うだけ料金が高くなる。北と中央カリフォルニア州に電力を提供しているPG&E社の地域では、データセンターのように大量の電力を消費する消費者には、時間によって変化する料金体系が科せられている。kWあたりの値段は一日のうち時間によって変化する。一般的に午後に一番高くなる。その上、一年のうち何日かはピーク日というものが決められており、その日は更に高い料金が上乗せされる。

デマンド費
PG&E社によるとデマンド値は:
住宅用でない多くの料金はデマンド費を含む。デマンドは1ヶ月の料金サイクルの間で15分(または短い場合は5分)の間に消費れた最大の電力の計測値であり、kWで表される。大きなデマンドは通常装置の立ち上がり時に見られる。全ての装置を一度に立ち上げずに分けて立ち上げることで、デマンド費を小さく抑えることができる。

負荷が変動し、時々突出すると高いデマンド値が科せられる。 出来るだけ、負荷による需要を平坦にすることが肝要だ。

データセンターで電力料金を削減するにはどうすれば良いのだろうか。例えば、以下のような方策を採用することだ。

*適切な電力容量を設計し計画する。
*高騰するデマンド費を避けるため出来るだけ負荷の変動を防ぎ一律の負荷分布にする。
*ピーク時やピーク日の料金に注意を払う。


上は当然のことの様だが、適正な電力容量を決定するのは容易なことではない。一般に将来の拡張を考慮して余裕を持たして設定し、大きく設定しがちである。また、多くのデータセンターはミッション・クリティカルであるため、ピーク時でも停止せず運転する必要がある。また、負荷をできるだけ上下なしに配分することは容易ではない。

いつ電力をコントロールするのか
電力は一旦発電されると大量に貯蔵できず、すぐに消費されなければならない。言い換えれば、電力は供給を制御できないので、需要を制御するしかない。これはデータセンターでも同じことだ。制御とは負荷による需要を軽減することである。ではいつ負荷を軽減すれば良いのだろうか。それは、電力料金が高くなったとき、または電力が不足している時だ。それに使われるのがデマンド・リスポンスだ。PG&E社はデマンド・リスポンスを次のように説明している:

PG&E社のデマンド・リスポンスは消費者が需要のピーク時にエネルギー負荷を軽減することができるようにしたプログラムである。 大抵のPG&E社の デマンド・リスポンスは需要のピーク時に負荷軽減のための経済的な誘因を与えるという側面も持っている。


デマンド・リスポンスはデータセンターにはあまりなじみのないものだった。と言うのは、データセンターはミッション・クリティカルと考えられて何があっても停止されないと思われて来たからだ。しかしながら、研究用やテスト用のデータセンターの負荷は軽減することが可能であろう。

その2で実際にどのようにしてソフトウエア定義の電力を実装できるのか、その1つを示そう。

このブログの電力料金に関しては、Power Assure社のPeter Maltbaek氏に色々と助言を頂いた。
posted by infogreen at 01:39| Comment(0) | ICTとエネルギー