IT

【超初心者向け】RAIDとは?シンプルにまとめます。

本記事は教養記事シリーズその51です。その他の教養記事は【超初心者向け】3分で分かる!教養記事シリーズ目次をご覧ください。

★この記事の流れ★

RAIDとは
様々な組み合わせ

本記事は初学者の理解を優先しているため正確性に欠ける場合があります。致命的なミスはご指摘いただけますと助かります。

RAID

RAIDはRedundant Array of Inexpensive Disksの頭文字を取った略称で,日本語に直すと「安価なディスク配列による冗長化」となります。

 

ディスク配列ってなに?

 

簡単に言ってしまえば,ディスクというのはHDDのような記録媒体だと思ってしまってOKです。単に1つのHDDにデータを記録するのではなく,複数のHDDを「冗長に」利用することで,様々な恩恵を受けることができます。

【複数のディスクを利用するメリット】
●容量の拡大
●処理速度の向上
●信頼性(バックアップ)の担保

 

まとめると,RAIDは複数のディスクを組み合わせて1つのディスクのように扱う技術のことを指します。ディスクの組み合わせによって以下のように分類することができます。

【RAIDの種類】
●RAID0
●RAID1
●RAID01
●RAID10
●RAID2
●RAID3
●RAID4
●RAID5
●RAID50
●RAID6

 

RAID0

複数のディスクに異なる内容のデータを保存する方法です。処理速度の向上が期待できる一方で,信頼性に問題があります。

別名ストライピングとも呼ばれています。

 

RAID1

複数のディスクに同じ内容のデータを書き込む方法です。信頼性が担保される一方で,容量を食ってしまう問題があります。

別名ミラーリングと呼ばれています。

 

RAID01

RAID0→RAID1の順番で組み合わせる方法です。両者の欠点をうまく補いながらデータを処理することが期待されます。

 

RAID10

RAID1→RAID0の順番で組み合わせる方法です。RAID01同様に,両者の欠点をうまく補いながらデータを処理することが期待されます。また,RAID10よりも信頼性の高い構造と言われているようです。

最初にRAID1を施すことで,データ損傷のパターンがRAID01に比べて少なくなるイメージです。

 

RAID2

RAID2は信頼性の担保に振り切った方法です。具体的には,データをbit(Byte)単位で2つのディスクに格納し,さらに誤り検出用のデータを3つのディスクに格納します。合計で5つのディスクが必要です。現在では,あまり使用されていない方法らしいです。

誤り検出にはハミング符号を利用します。ハミング符号は,2bitのデータに対して3bitの容量が必要なため,2台のディスクに対して3台の誤り検出用のディスクが必要だということです。

 

RAID3

RAID2ではハミング符号を利用して誤りを検出していましたが,パリティを利用する方法がRAID3です。パリティでは,誤り検出用のディスクは1台で済みます。

しかし,ハミングコードに比べて訂正できる誤りのパターンが少ないため,信頼性は低下してしまいます。残念ながら,RAID5の登場により,こちらの手法は現在あまり使われていないようです。

パリティでは1bitのエラー検出はできますが,2bit以上のエラーは対応不能です。一方,ハミング符号では,1bitのエラーであれば検出と訂正が行え,2bitのエラーでは検出が行えます。

 

RAID4

RAID4は,RAID3をブロック単位で処理を行うことで効率化した方法です。こちらも,RAID5の登場により,現在はあまり使われていないようです。

 

RAID5

RAID4の誤り検出用のディスクに格納するべきデータを,他のディスクに分散させる方法です。今までは,誤り検出専用のディスクがあったのですが,各ディスクの誤り検出用のデータをいちいち1つのディスクに格納するのは負荷が偏ってしまいます。そこで,できるだけ複数のディスクに処理を分担させることでバランスを取った手法が,RAID5になります。

 

RAID50

RAID5→RAID0の順番で組み合わせる方法です。RAID5の処理速度をさらに向上させたい場合に使用されます。

 

RAID6

RAID6は,誤り検出用のデータをRAID5の形式で分散させて,複数保持する方法です。RAID5よりも信頼性が上がる一方で,容量を食うことになってしまいます。

 

現在の主流

現在の主流は,RAID0,RAID1,RAID5とのことです。それぞれ,処理速度型,信頼性型,バランス型の方法だと考えればOKです。

【簡単なまとめ】
●RAID0:処理速度タイプ
●RAID1:信頼性タイプ
●RAID5:バランス型タイプ

 

ひとこと

情報系の分野では,トレードオフの概念がよく出てきますね。それは当然のことで,どこかを改善しようとすれば,それに対応する形で他の箇所に問題が起こってしまうものなのでしょう。

 

応用情報の参考書ならコチラをどうぞ!

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です