フーリエ変換

【サーベイまとめ】データハイディングとは?電子透かしとステガノグラフィの違いまで。

この記事では,研究のサーベイをまとめていきたいと思います。ただし,全ての論文が網羅されている訳ではありません。また,分かりやすいように多少意訳した部分もあります。ですので,参考程度におさめていただければ幸いです。間違えている箇所がございましたらご指摘ください。随時更新予定です。

参考文献は最後に記載してあります。

 

データハイディングとは

栗林先生によると

データハイディング (Data Hiding) は、インフォメーションハイディング (Information Hiding) とも呼ばれ、直訳すれば “情報を隠す” という意味であり、秘密の情報を密かに忍ばせることや、通信自体を隠すことを意味する。

「データハイディングの諸技術とその機能」

と述べられています。栗林先生の論文は枕として上記内容が繰り返されています。データハイディングは,インターネットとディジタルメディアの普及に伴って注目を浴びています。

 

必要な理由

暗号化の概念図

データハイディングと似た技術として暗号理論が挙げられます。暗号技術は二者間で通信を行う際には通信内容は隠すことができますが,通信を行っていること自体が第三者にバレてしまいます。また,暗号技術のみでは通信相手によるコンテンツの不正配布を取り締まることはできません。そこで,通信自体を隠したり情報を密かに埋め込む技術であるデータハイディングが重要になってきます。以下では,データハイディングの分類を見ていきたいと思います。

基本的に栗林先生の論文に基づいて説明していきます。

 

分類

電子透かしの概要
ステガノグラフィの概要

【データハイディング】
●ステガノグラフィ
●電子透かし
ーロバスト/ブラインド方式
ーロバスト/非ブラインド方式
ーフラジャイル/ブラインド方式
ーフラジャイル/非ブラインド方式

データハイディングは大きく分けて「ステガノグラフィ」と「電子透かし」に分けられます。ステガノグラフィは埋め込む情報が重要であり,かつその存在が知られないことが求められる状況で用いられます。電子透かしは,秘密の情報が埋め込まれたコンテンツ自体が重要な状況で用いられます。それぞれの手法に求められる要件について確認します。

【ステガノグラフィ】
• 秘密情報の埋め込みが知覚されない
• 埋め込み可能な情報量は多い方が望ましい
• 埋め込み位置はどこでもよい
• 攻撃に対する耐性は考慮しなくてよい

【電子透かし】
• 秘密情報の埋め込みは知覚されない
• 埋め込む情報量はあまり多くない
• 透かし情報はコンテンツ全体に埋め込む
• 攻撃に対する耐性が高い

求められる要件の比較

また,電子透かし技術はロバストとフラジャイルに分けられます。ロバストとは,コンテンツに対する攻撃に高い耐性をもつ手法です。主に著作権管理の目的で利用されます。フラジャイルとは,コンテンツに対する攻撃に敏感な手法です。主に改ざん検知の目的で利用されます。

さらに,電子透かし技術はブラインド方式と非ブラインド方式に分けられます。ブラインド方式では,埋め込まれた情報を検出するのに透かし前のコンテンツを必要としません。反対に,非ブラインド方式では埋め込まれた情報を検出するのに透かし前のコンテンツを必要とします。一般に,元のコンテンツの特定は難しく実用上はブラインド方式が望ましいとされています。

データハイディングの流れ

 

実現手法

置換法の概念図
量子化法の概念図

データハイディングの基本的なアイディアは人間の知覚特性を利用してバレないように情報を隠すという方針です。たとえば,人間の耳は特定の周波数帯しか聞き取ることができません。モスキート音などもその一例です。データハイディングでは,この人間の耳の特性を生かしてバレない周波数帯に情報を埋め込むのです。人間が知覚しにくい特徴を利用するというのがデータハイディングにおける基本的な考え方です。デジタルメディアにおいて人間の知覚特性は以下のように分類されます。

【人間の知覚特性】
①時間領域
②周波数領域
③A/D変換

【各手法の具体例】
①エコー拡散法/位相変調法
②スペクトル拡散法
③量子化法

一般に,デジタルメディアというのは時系列信号の周波数をいじることで生成されます。ですので,アプローチ方法としては時系列信号の特徴を扱う方法(①),周波数の特徴を扱う方法(②)が考えられます。また③のA/D変換というのはアナログ信号をデジタル信号に変換する処理のことを指します。

アナログ→デジタルの変換は主に「標本化→量子化→符号化」の順番で行われます。すなわち,連続的な信号をある間隔で切り出して(標本化),影響の少ない範囲で扱いやすい桁数に揃えます(量子化)。その後,コンピュータに認識させるために0と1のビット列に変換します(符号化)。このアナログ→デジタル変換の中の「量子化」の部分に着目して透かしを埋め込む方法が考案されています。これが,デジタルメディアの特性を利用したデータハイディングです。

また一般に,データハイディングの実用的な面は著作権保護などで用いられているロバスト電子透かしです。ロバスト電子透かしの方針も,上述の知覚特性を利用したアプローチが考えられます。さらにロバスト性からアプローチをすると,以下の方法が考えられます。

【ロバスト性のアプローチ】
①ロバストな特徴を選択する
②透かし情報に冗長性を持たせる

 

評価方法

データハイディングの評価は以下の三観点でなされます。

【データハイディングの評価】
①埋め込み品質
②埋め込み容量
③攻撃耐性

①はコンテンツの種類(音声/音楽/画像…)によって基準が異なります。音であればPQevalAudioから算出されるODGという指標がよく使われます。他にも,音響ハイディングの分野では

●WSS距離(音質)
●PESQ(音声の品質評価)
●NRR(雑音抑圧量)
●LLR(対数尤度比)
●LSD(対数スペクトル歪み)
●SDR(信号対歪み比)

のような指標が用いられます。②はステガノグラフィか電子透かしかによって目指す基準は異なります。基本的には単位はbitを用います。音データであればbps(1秒あたりの転送ビット数)もよく使われます。③については,IHC委員会が統一評価基準を発表しています。例えば

●MP3圧縮(1回/2回)
●MPEG4
●ガウス性雑音付加
●バンドパスフィルタ

のような攻撃を仕掛けて検出した透かしのBER(エラー率)を計算します。要するに,攻撃が仕掛けられた際にどれだけ正しい情報を抽出できるかどうかということになります。

 

トレードオフ

一般に,上述の三観点はトレードオフの関係にあります。ただし,ステガノグラフィは③攻撃耐性を考慮しなくてもよいことに注意します。

【ステガノグラフィのトレードオフ】
①埋め込み品質
②埋め込み容量

【電子透かしのトレードオフ】
①埋め込み品質
②埋め込み容量
③攻撃耐性

 

セキュリティ

上述の電子透かしとステガノグラフィの違いから,セキュリティを考慮するべきなのはロバスト電子透かしになります。ここで,電子透かしにおけるロバスト評価と安全評価についてまとめておきます。

【ロバスト評価】
電子透かしシステムの仕様が公開されない場合の評価。コンテンツ全体に対して何らかの歪みを生じさせる攻撃を想定。

【安全評価】
電子透かしシステムの仕様が公開される場合の評価。特定のコンテンツに対して何らかの歪みを歪みを生じさせる攻撃を想定。

安全評価の状況はシステムのアルゴリズムが秘密鍵を除いて全て公開されるという「ケルクホフスの原理」に基づきます。

 

本来であれば,ケルクホフスの原理に基づくロバスト性の評価がされるべきですが,現状ではコンテンツ全体を狙った攻撃のみ想定された評価基準になっています。

 

まとめ

私が注目しているのが

●ロバスト電子透かし
●ブラインド方式
●周波数領域を利用
●透かし情報に冗長性を持たせる

というデータハイディングであるため,評価というのは

①埋め込み品質
→ODG
②埋め込み容量
→少なくてもOK
③攻撃耐性
→IHC基準によるBER

として考えています。課題としては

●ケルクホフスの原理に基づいた評価
●完全ブラインド方式にする

が残っています。これからも精進していきます。

参考文献

●「データハイディング技術における攻撃耐性」(栗林,2018,電子情報学会)
●「映像情報メディア関連のセキュリティ第9回」(栗林,2015,映像情報メディア学会誌)

ABOUT ME
zuka
京都大学で機械学習を学んでいます。

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

※ Please enter your comments in Japanese to prevent spam.