ハードウェア
ブロードバンド時代を拓くストレージネットワーキング
石井健夫 (Techno-Stream vol.25 May 2002)
まあまあ(10点)
2002年5月15日
ストレージ(記憶装置)をネットワーク上で管理する技術について、ざっと一通り説明した記事。
Techno-Stream は NTT アドバンスドテクノロジが発行している小冊子で、執筆者の多くは社内の人らしいが、アルプス電気の人が光ファイバの受光レンズについて書いていたり、社外の人も記事を書いている。作者の石井健夫も社内の人である。
ストレージをネットワークで管理することをストレージネットワーキングと呼んでいるのだと思うのだが、旧来のものも含めてストレージの管理方法には主に DAS NAS SAN iSCSI があるらしい。
DAS というのは要するにマシンに内蔵されているハードディスクみたいなもの全般を指し、マシンに直接つなげてそのマシンだけで使う方式である。
NAS というのはまあ色々あるが、一番簡単なのはホームページスペースみたいなものである。ホームページスペースを用意してくれるプロバイダなどは、ページを公開するかどうかは別として、好きな画像やデータを置いておくことができる。だから、自宅のマシンのハードディスクがクラッシュしたときに備えて、重要なデータをホームページスペースにコピーしておくバックアップのようなことができる。また、他の人もアクセスできる場所に置いておくと、他人とデータを共有することもできる。
NAS といえば、いわゆるファイルサーバもそうである。学校や会社では、みんなで使うデータやバックアップが必要な重要なデータは、ファイルサーバを作ってそこに入れておくことが多い。24時間電源を入れておくと、個人が使うマシンの電源を落としても、ファイルのやりとりができる。また、ファイルサーバにバックアップ装置をつなげて定期的にバックアップをとるようにすれば、おのおののマシンにバックアップ装置をつなげる必要もない。
iSCSI というのは、NAS よりも細かくストレージにアクセスしたいときに使うやりかたの代表例で、ストレージをファイルサーバとしてではなくディスクサーバとして使う。この違いは、ストレージの物理ディスクの好きな場所に好きなデータを書き込める点にある、のではないだろうか。ファイル管理というのは、ストレージ管理の一つの方法であり、扱うデータによっては他にもっと便利な管理方法がある。たとえばリレーショナルデータベースなんかがそうで、リレーショナルデータベースはファイルシステム上のファイルでも構築できるのだが、無駄な部分がなく直接ストレージを管理したほうがパフォーマンスが高くなる。
iSCSI の欠点は、NAS と違ってデータを共有できない点にある。つまり、マシンに内蔵するはずのハードディスクを、ネットワーク上に移しただけなのである。ネットワーク上を行き交うデータも、ハードディスクをマシンに直接接続して管理するための SCSI プロトコルをそのまま TCP/IP に載せただけなのだそうだ。
一方、SAN というのはなじみが薄いが、要するにストレージだけのネットワークを用意することである。なぜわざわざ別のネットワークを用意するかというと、大量のデータを素早く受け渡しする必要があるからである。このような必要があるのは、頻繁に大量にデータを受け渡しする必要のある一部のサーバだけなので、これらのサーバと複数のストレージをつなげれば、個人個人が使っているマシンの回線とは関係なく大量のデータをやりとりできる。たとえば、ある人のマシンがサーバに対して、データを元に集計して結果を報告せよと指示を出すとする。するとそのサーバは、専用のストレージネットワークにつながっているいくつかのストレージから 100 や 1000 の大きさのデータを読み書きし、それをもとに 10 の大きさの集計結果にまとめ、通常のネットワークを通じてその人のマシンに送り返すのである。こうすることで、100 や 1000 の大きさを持つ巨大なデータが通常のネットワークを圧迫せずに済む。
ではなぜストレージをネットワークで管理する必要があるのか。サーバが必要とするデータは、サーバに直接つなげたほうがいいのではないか。通常はそうである。しかし、複数のサーバがデータを必要とするのであれば、一つのサーバに直接つなぐわけにはいかなくなる。また、複数のサーバが使うのであれば、ファイルサーバを置けば良いのではないかということになりそうだが、大量のデータをさばくにはファイルサーバでは効率が悪い。また、複数のストレージをネットワークで管理し、RAID によりいくつかのストレージをあたかも一台のストレージに見せかけたりして、扱いやすくしたり性能や信頼性を高めたりすることができる。もっとも、ファイルサーバと比べると排他処理が弱いという弱点もありそうである。
私がここまで丁寧に(?)解説してきたのは、記事を普通に読むだけではあまり伝わってこないように思ったからである。業界人に向けて書かれた解説だということであるにしても、もっと分かりやすく書けたのではないだろうか。かといって事実だけを淡々と書いているわけでもないし、ここはどうなっているんだともっと突っ込みたくなる部分もあった。まあ、前に友人から話を聞いたときよりは分かりやすかったので、こういう記事はありがたい。
私の理解に間違っている部分があればおしえてほしい。
Techno-Stream は NTT アドバンスドテクノロジが発行している小冊子で、執筆者の多くは社内の人らしいが、アルプス電気の人が光ファイバの受光レンズについて書いていたり、社外の人も記事を書いている。作者の石井健夫も社内の人である。
ストレージをネットワークで管理することをストレージネットワーキングと呼んでいるのだと思うのだが、旧来のものも含めてストレージの管理方法には主に DAS NAS SAN iSCSI があるらしい。
DAS というのは要するにマシンに内蔵されているハードディスクみたいなもの全般を指し、マシンに直接つなげてそのマシンだけで使う方式である。
NAS というのはまあ色々あるが、一番簡単なのはホームページスペースみたいなものである。ホームページスペースを用意してくれるプロバイダなどは、ページを公開するかどうかは別として、好きな画像やデータを置いておくことができる。だから、自宅のマシンのハードディスクがクラッシュしたときに備えて、重要なデータをホームページスペースにコピーしておくバックアップのようなことができる。また、他の人もアクセスできる場所に置いておくと、他人とデータを共有することもできる。
NAS といえば、いわゆるファイルサーバもそうである。学校や会社では、みんなで使うデータやバックアップが必要な重要なデータは、ファイルサーバを作ってそこに入れておくことが多い。24時間電源を入れておくと、個人が使うマシンの電源を落としても、ファイルのやりとりができる。また、ファイルサーバにバックアップ装置をつなげて定期的にバックアップをとるようにすれば、おのおののマシンにバックアップ装置をつなげる必要もない。
iSCSI というのは、NAS よりも細かくストレージにアクセスしたいときに使うやりかたの代表例で、ストレージをファイルサーバとしてではなくディスクサーバとして使う。この違いは、ストレージの物理ディスクの好きな場所に好きなデータを書き込める点にある、のではないだろうか。ファイル管理というのは、ストレージ管理の一つの方法であり、扱うデータによっては他にもっと便利な管理方法がある。たとえばリレーショナルデータベースなんかがそうで、リレーショナルデータベースはファイルシステム上のファイルでも構築できるのだが、無駄な部分がなく直接ストレージを管理したほうがパフォーマンスが高くなる。
iSCSI の欠点は、NAS と違ってデータを共有できない点にある。つまり、マシンに内蔵するはずのハードディスクを、ネットワーク上に移しただけなのである。ネットワーク上を行き交うデータも、ハードディスクをマシンに直接接続して管理するための SCSI プロトコルをそのまま TCP/IP に載せただけなのだそうだ。
一方、SAN というのはなじみが薄いが、要するにストレージだけのネットワークを用意することである。なぜわざわざ別のネットワークを用意するかというと、大量のデータを素早く受け渡しする必要があるからである。このような必要があるのは、頻繁に大量にデータを受け渡しする必要のある一部のサーバだけなので、これらのサーバと複数のストレージをつなげれば、個人個人が使っているマシンの回線とは関係なく大量のデータをやりとりできる。たとえば、ある人のマシンがサーバに対して、データを元に集計して結果を報告せよと指示を出すとする。するとそのサーバは、専用のストレージネットワークにつながっているいくつかのストレージから 100 や 1000 の大きさのデータを読み書きし、それをもとに 10 の大きさの集計結果にまとめ、通常のネットワークを通じてその人のマシンに送り返すのである。こうすることで、100 や 1000 の大きさを持つ巨大なデータが通常のネットワークを圧迫せずに済む。
ではなぜストレージをネットワークで管理する必要があるのか。サーバが必要とするデータは、サーバに直接つなげたほうがいいのではないか。通常はそうである。しかし、複数のサーバがデータを必要とするのであれば、一つのサーバに直接つなぐわけにはいかなくなる。また、複数のサーバが使うのであれば、ファイルサーバを置けば良いのではないかということになりそうだが、大量のデータをさばくにはファイルサーバでは効率が悪い。また、複数のストレージをネットワークで管理し、RAID によりいくつかのストレージをあたかも一台のストレージに見せかけたりして、扱いやすくしたり性能や信頼性を高めたりすることができる。もっとも、ファイルサーバと比べると排他処理が弱いという弱点もありそうである。
私がここまで丁寧に(?)解説してきたのは、記事を普通に読むだけではあまり伝わってこないように思ったからである。業界人に向けて書かれた解説だということであるにしても、もっと分かりやすく書けたのではないだろうか。かといって事実だけを淡々と書いているわけでもないし、ここはどうなっているんだともっと突っ込みたくなる部分もあった。まあ、前に友人から話を聞いたときよりは分かりやすかったので、こういう記事はありがたい。
私の理解に間違っている部分があればおしえてほしい。