[目次] [1ページ目] [前ページ] [次ページ]
( 6 / 9 )

6.CORBAの課題 −システム構築後の問題点の顕在化−

    【松澤】
     GRIDについて議論を進めてきていますが、これに関する皆さんのお考え、ご意見等がありましたらお願いします。

    【真鍋】(高エネルギー加速器研究機構計算科学センター)
     先ほどの水本さんのご質問の中で、分散環境を使って広域で実際に研究を行おうとしたところ、いろいろな問題点があったとお話されました。高エネ研でも同じような問題点があると思うのですが、GRIDでやって大丈夫なのですかというご質問がありました。天文台では、具体的にどのような問題点があったのかお聞かせいただきたいのですが。 問題点を私なりの経験で考えますと、2つのことが思い当たります。ひとつはネットワークの速度が低すぎたなど、可能なリソースや品質が悪すぎて実用にならないということです。例えば、テレビ会議を例にとると、当初は、あまり意味のない映像のために、大事な声が全然聞こえなくて役に立たなかったりすることです。このようなものはある程度、通信のバンド幅が大きくなることによって解決するものかもしれません。もうひとつは、ローカルな環境で大規模な分散環境を使った場合も同様なのですが、非常に複雑なシステムになってしまい、問題なく動いているときはいいのですけれども、何かトラブルが起こったとき、解決するのにとても苦労することです。
     また、規模が大きくなると、小規模では問題なく動作しているものも、その高負荷状況などから、それまでは顕在化していなかった問題が表面化するのです。それは、性能的にも障害の観点からもあります。例えばGRIDのひとつの機能を提供しているサーバが、今まで1対1でやりとりしていた場合は問題にならなかったのに、全世界からアクセスされて、負荷が非常に大きくなったとき、どのようなことが起こるか、その問題点をちゃんと解決する上手いスキームみたいなものがあるかということです。
     このようなことが思い当たるのですが、実際には天文台での過去の問題点というのはどこにあったのでしょうか。

    【松澤】
     では、水本さん、お願いします。

    【水本】
     問題点は沢山あるのです。
     まず一番最初の問題ですが、サーバが1台とか2台ではなく20台もあると、まずユーザ側がシームレスに使いたいということがあります。例えば、スパコンからパソコンまであるようなシステムの中で、どこから使っても同じような環境にしたいというのがまずあったわけです。データは「すばる」から一番最初に取られてきているので一箇所にあるのですが、ここに皆が呼びに行くので、アクセスが集中してしまい、いろいろな問題が起こるだろうと考えたのです。
     ですから、データをどのように分散させればいいのかなと思いました。しかし、実際にはデータ分散はあまり考えていなく、まずCPU負荷をどうやって平均的に分散させるかを考えたのです。そのようなこともあり、データネックになってしまい、同じデータを皆んなで取りに行くと、結局はネットワークの細さ、そこはいわゆる10baseとか、255MbpsのFibreChannelネットワークだったのですが、それでは遅すぎるということがよくわかったのです。負荷分散しようとしてもサーバが20台もあると、それが現在どのような状態で動いているかということがわからない。システム管理者もいない状態で、それがわからないと、何かおかしなことが起こっているのか、あるいはちゃんと自分のジョブが動いているのかよくわからないのです。ユーザから見ると、「こんなシステム使えるか馬鹿野郎」と言われてしまうのですね。
     もうひとつですが、CORBAの難点というのは、先ほどマーシャリングという言葉が出てきましたが、大量データを送るようにはできていないのです。そこの部分の定義がなく、それを今のCORBAのプロトコルに載せて送ろうとすると、そこがすごく遅くなってしまうのです。いわゆるそのマーシャリングネックになってしまっています。「自分のローカルディスク上で行ったら待たないで動いてしまうのに、何でこんなに待たなくてはいけないのか、こんなもの使えるか。」というふうに、利用者からの非難の声が轟々にあがってしまうのです。そして、利用者は今までの経験があるから自分のジョブがここのサーバで動いているのを知りたいというのです。それを知らせないようなシステムにわざわざ作ったのにですね、やはり知りたいのだそうです。しかもここのマシンで動いて欲しいとかいう要求が出てくるとそれをいわゆるネットワーク負荷分散型でやっているとこれを組み込むのはなかなか難しいし、逆に組み込んでしまうと最初のポリシーとずれてしまうわけです。だからそのような利用者側の要求と作る側の設計思想が合わない部分があったということが一番の難点でした。もちろん、CORBAを使えば我々の言っていることができるのかなと思ったのですが、CORBAの標準化の中に大量のデータ転送という機能がなかったことです。
     そして、セキュリティの問題です。データセキュリティの問題があり、「レイヤー8」ではありませんが、自分のデータの抱え込みというのがあり、同じ部署だけど人には見せたくない。自分が何をやっているかも見せたくもないのです。そのようなものをどのようにシステムの中に保証していくかはすごく難しい問題なのです。ところが、ある時間がたつとそのようなデータは皆、開放するんだよということになってますので、開放系と閉鎖系の両方をひとつのシステムの中に作るというのはなかなか難しかったのです。それを別々にしてしまえばいいのではないかという極端なこともあり、今のところはその解がないという状況です。問題点は沢山あるということです。


[目次] [1ページ目] [前ページ] [次ページ]