IT

【超初心者向け】DD/D(データディクショナリ/ディレクトリ)とは?シンプルにまとめます。

本記事は教養記事シリーズその49です。その他の教養記事は【超初心者向け】3分で分かる!教養記事シリーズ目次をご覧ください。

★この記事の流れ★

メタデータ
データディクショナリ
データディレクトリ
分散データベース
集中管理方式
分散管理方式

本記事は初学者の理解を優先しているため正確性に欠ける場合があります。致命的なミスはご指摘いただけますと助かります。

データディクショナリ

データベースを利用するときはメタデータが必要になる

システムで扱うデータの定義をまとめた辞書のことを,データディクショナリと呼びます。DBMS(データベースを便利に扱うためのシステム)では,データとメタデータをセットで扱うことが多いため,データディクショナリのようなメタデータが必要になるのです。

メタデータとは,データの属性や格納場所などを表した,「データについて記述したデータ」のことを指します。

 

ちなみに,データディレクトリというのは,データディクショナリをコンピュータ用に翻訳したメタデータになります。レポジトリというのは,メタデータを集中的に管理するデータベースのことを指すことが多いです。

 

分散データベース

みんなで協力してデータベースを管理しよう

普通は,各サイトでメタデータを保管するのですが,メタデータをより効率よく管理するために,メタデータを分散させて管理する方法があります。これを,分散データベースと呼びます。

この方式では,どのサイトからもアクセス可能な状態でメタデータを保管することで,ネットワークの特性を生かしたメタデータの保管方法が可能になります。言い換えれば,各サイトは,どこからでもアクセス可能なグローバルなデータディクショナリ/ディレクトリ(DD/D)を用意する必要があります。

グローバルなDD/Dの設置方法は,大きく2つに分けられます。まず,1つのサイトに集中してDD/Dを管理させる「集中管理方式」が挙げられます。次に,複数のサイトに分散させてDD/Dを管理させる「分散管理方式」も挙げられます。特に,分散管理方式では,各サイトが持つ情報に重複がある場合と,ない場合で分類されることもあります。

集中管理方式

各サイトが重複を許して自分に関係のあるメタデータだけを保持すれば,必要な情報はすぐに手に入ります。一方で,データベースの更新をする際には,他のサイトが自分のデータを保持している可能性があるため,全てのサイトでDD/Dを修正する必要があります。

分散管理方式(重複あり)

一方,各サイトが重複をせずにDD/Dを保持していれば,データベースの更新は自分の保持しているデータだけでOKなのですが,手に入れたい情報を他のサイトに問い合わせる必要があります。これらの特性を踏まえて,データベースの設計を行う必要があります。

分散管理方式(重複なし)

 

ひとこと

データベースの保管方法は,よくある「集中 vs 分散」の議論でした。リスクを取るか,効率を取るかといったところでしょうか。また,効率と一口には言っても,どの場面で効率を重視するかによって,ディクショナリの保持様式が変わるのですね。

 

応用情報の参考書ならコチラをどうぞ!

ABOUT ME
zuka
京都大学で機械学習を学んでいます。

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

※ Please enter your comments in Japanese to prevent spam.