本記事は教養記事シリーズその49です。その他の教養記事は【超初心者向け】3分で分かる!教養記事シリーズ目次をご覧ください。
データディクショナリ
データディレクトリ
分散データベース
集中管理方式
分散管理方式
読みたい場所へジャンプ!
データディクショナリ
システムで扱うデータの定義をまとめた辞書のことを,データディクショナリと呼びます。DBMS(データベースを便利に扱うためのシステム)では,データとメタデータをセットで扱うことが多いため,データディクショナリのようなメタデータが必要になるのです。
ちなみに,データディレクトリというのは,データディクショナリをコンピュータ用に翻訳したメタデータになります。レポジトリというのは,メタデータを集中的に管理するデータベースのことを指すことが多いです。
分散データベース
普通は,各サイトでメタデータを保管するのですが,メタデータをより効率よく管理するために,メタデータを分散させて管理する方法があります。これを,分散データベースと呼びます。
この方式では,どのサイトからもアクセス可能な状態でメタデータを保管することで,ネットワークの特性を生かしたメタデータの保管方法が可能になります。言い換えれば,各サイトは,どこからでもアクセス可能なグローバルなデータディクショナリ/ディレクトリ(DD/D)を用意する必要があります。
グローバルなDD/Dの設置方法は,大きく2つに分けられます。まず,1つのサイトに集中してDD/Dを管理させる「集中管理方式」が挙げられます。次に,複数のサイトに分散させてDD/Dを管理させる「分散管理方式」も挙げられます。特に,分散管理方式では,各サイトが持つ情報に重複がある場合と,ない場合で分類されることもあります。
各サイトが重複を許して自分に関係のあるメタデータだけを保持すれば,必要な情報はすぐに手に入ります。一方で,データベースの更新をする際には,他のサイトが自分のデータを保持している可能性があるため,全てのサイトでDD/Dを修正する必要があります。
一方,各サイトが重複をせずにDD/Dを保持していれば,データベースの更新は自分の保持しているデータだけでOKなのですが,手に入れたい情報を他のサイトに問い合わせる必要があります。これらの特性を踏まえて,データベースの設計を行う必要があります。
ひとこと
データベースの保管方法は,よくある「集中 vs 分散」の議論でした。リスクを取るか,効率を取るかといったところでしょうか。また,効率と一口には言っても,どの場面で効率を重視するかによって,ディクショナリの保持様式が変わるのですね。