アカデミック

【第５章ニューラルネットワーク】PRML演習問題解答を全力で分かりやすく解説＜5.5＞

zuka 2019年5月29日 / 2021年2月9日

本記事はPRML「パターン認識と機械学習＜上＞第７版」（C.M.ビショップ著）の演習問題の基本問題・標準問題を解説したページになります。数式を打ち込む手間が面倒だったので，画像ファイルでアップしています。

また，数学的に厳密な議論はしていません。その代わり，初学者がつまづきやすいポイントを重点的にお伝えしていくつもりです。PRML解答/解説の目次もご覧ください。

もし間違い等がございましたら，ご指摘いただけますと助かります。

こちらの問題の誤植をzyunpe様よりご指摘いただきました。多クラス分類の尤度関数はカテゴリカル確率ですので，式(4.107)で表されます。訂正後の解答を最初に示して，その後に訂正前の解答を示しておきます。

5.5（訂正後）

式(4.107)に基づく対数尤度関数は以下のように表されます。なお，演習問題の文中では尤度関数が$p(t_k=1|\mathbf{x})$と表されていますが，これはニューラルネットワークの重みを省略していますので，正確には$p(\mathbf{t_k=1 | \mathbf{x}, \mathbf{w}})$です。また，$t_k=1$はベクトルを用いて$\mathbf{t}$と表すことができますので，結局$p(t_k=1 | \mathbf{x}, \mathbf{w})=p(\mathbf{\mathbf{t} | \mathbf{x}, \mathbf{w}})$になります。

\begin{align}
\log y_k(\mathbf{x}, \mathbf{w})
&= \log p(\mathbf{t}|\mathbf{x}, \mathbf{w})\\
&= \log \prod_{n=1}^{N}
\prod_{k=1}^{K}
y_{nk}^{t_{nk}} \\
&= \sum_{n=1}^{N}
\sum_{k=1}^{K}
t_{nk} \log y_{nk}
\end{align}

したがって，対数尤度の最大化は交差エントロピー誤差関数(5.24)を最小化することと等価です。なお，尤度最大化とクロスエントロピー最小化の議論は以下のページでも行っています。

【初学者向け】クロスエントロピーを分かりやすく解説。この記事では，クロスエントロピーとは何かについてお伝えしていきます。深層学習ではとりあえずクロスエントロピーを使っておけば良いというよ...

5.5（訂正前）

負の対数尤度を計算するだけです。

パターン認識と機械学習上

PRML解答解説目次へ

prml

アカデミック

【第２章確率分布】PRML演習問題解答を全力で分かりやすく解説＜2.40＞

2019年5月4日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【第９章】PRML演習問題解答を全力で分かりやすく解説＜9.3＞

2019年7月12日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【レビュー/内容まとめ】ベイズ推論による機械学習入門

2019年5月16日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【第８章】PRML演習問題解答を全力で分かりやすく解説＜8.12＞

2019年6月19日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【第８章】PRML演習問題解答を全力で分かりやすく解説＜8.21＞

2019年6月19日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【超初心者向け】AE(AutoEncoder)をPython(PyTorch)で実装してみる。

2019年9月15日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

POSTED COMMENT

zyunpe より:

2021年2月8日 7:19 PM

問題文では多クラスニューラルネットワークモデルについて，と言っているので，
使用する尤度関数は(5.22)ではなく，(4.107)で表されるものが正しいようです．
私もテキストの「(→演習5.5)」記載位置から，K個の2クラス分類問題のネットワーク
に対して適用すればいいのかと思いましたが，PRML公式の回答を見ると違うようです．

また，Beginaidさんの回答では，ln()を取る際に，２項目の(1-yk)にln()がかかっていない
ので，(5.24)と同じ式に変形できてしまったのかなと思いました．

最後になりますが，初めてコメントさせていただきます．
独学でPRMLを読んでいるので，いつも大変参考にさせていただいています．
これからも参考にさせていただきます．

返信
- zuka より:
  
  2021年2月9日 4:12 PM
  
  zyunpe様
  
  ご指摘ありがとうございます！
  本文を修正いたしました。
  
  参考にしていただき光栄です。
  誤植等あるとは存じていますが，またご指摘等いただけますと幸いです。