【サーベイまとめ】ガウス過程と深層学習の美しい関係。出来る限り分かりやすく簡潔に説明します。Beginaid

この記事では，研究のサーベイをまとめていきたいと思います。ただし，全ての論文が網羅されている訳ではありません。また，分かりやすいように多少意訳した部分もあります。ですので，参考程度におさめていただければ幸いです。

間違えている箇所がございましたらご指摘ください。随時更新予定です。他のサーベイまとめ記事はコチラのページをご覧ください。

参考文献は最後に記載してあります。

読みたい場所へジャンプ！

ガウス過程とは？
ガウス過程と深層学習
実験結果
まとめ
おすすめ参考書

ガウス過程とは？

【超初心者向け】ガウス過程とは？出来る限り分かりやすく簡潔に説明します。この記事では，研究のサーベイをまとめていきたいと思います。ただし，全ての論文が網羅されている訳ではありません。また，分かりやすいように多...

詳しくは，上の記事をご覧ください。

ガウス過程と深層学習

深層学習をガウス過程で表すことができるの？？

何だかスケールのデカい話だ！

以下は，”Deep Neyral Network As Gaussian Processes [Lee et al. 2018]”という論文をもとに執筆します。

実は，1990年代からニューラルネットワークと深層学習の関係性は指摘されていました。具体的には，隠れ層が１層のニューラルネットワークで隠れ層のユニット数を$\infty$にすると，ニューラルネットワークの出力はガウス過程と等価になるというのです。特に重要なポイントは，独立な確率密度関数の和が正規分布に従うようになる中心極限定理です。

今回は，カーネル関数として出力の積の期待値を定義します。こうすることで，隠れ層が１層だけのニューラルネットワークから$L$層のニューラルネットワークへと再帰的な拡張が可能になります。

というのも，カーネルを計算するとまたまた「積の期待値」という形が出現するのです。これにより，隠れ層が1層の場合のカーネルの計算結果を参考にして，$l$層目のカーネルを再帰的に定義することができます。ここでは，期待値は積分計算を含みますので，結果を$\phi$に依存する適当な関数$F_{\phi}$として表してしまいます。この際，層を重ねていることから，項として自分自身とのカーネルも含むことに注意が必要です。

勝手に定義した$F_{\phi}$ですが，非線形関数がランプ関数ReLUのときには解析的に求められることが分かっています。

しかし，非線形関数$\phi$に依存する$F_{\phi}$は他の非線形関数であった場合にはどう計算すればよいのでしょうか。そこで，Leeらは以下のようなルックアップテーブルを作成して，線形補間に基づくアイディアで近似しようと試みました。特筆すべきなのは，従来のDNNでは複雑な最適化アルゴリズムを経て出力を得ることができたわけですが，今回の「ガウス過程としての深層学習モデル」では，単なる行列計算によりパラメータの更新が可能になている点です。