アカデミック

【第２章確率分布】PRML演習問題解答を全力で分かりやすく解説＜2.38＞

zuka 2019年5月4日 / 2021年1月22日

本記事はPRML「パターン認識と機械学習＜上＞第７版」（C.M.ビショップ著）の演習問題の基本問題・標準問題を解説したページになります。数式を打ち込む手間が面倒だったので，画像ファイルでアップしています。

また，数学的に厳密な議論はしていません。その代わり，初学者がつまづきやすいポイントを重点的にお伝えしていくつもりです。目次はコチラの記事をご覧ください。

もし間違い等がございましたら，ご指摘いただけますと助かります。

2.38

$N$個の観測値から推定されたパラメータを計算で確認する問題です。平均は，ハイパーパラメータ$\mu_0$を最尤推定量$\mu_{ML}$で補正している式が導出されます。同じように，分散はハイパーパラメータ$\sigma_0$を既知の値$\sigma$で補正している式が導出されます。

以下コメント欄にてご指摘いただいた部分を反映したものになります。maki様ありがとうございます！

訂正後の解答

式(2.137)，式(2.138)，式(2.139)より，事後分布の指数部分に対する恒等式は以下のようになる．

\begin{align}
-\frac{1}{2\sigma^2} \sum_{n=1}^{N}\left(x_n – \mu\right)^2 – \frac{1}{2\sigma_0^2}\left(\mu – \mu_0^2\right)
&= – \frac{1}{2\sigma_N^2}(\mu – \mu_N^2)
\end{align}

$\mu$の次数に関して係数比較を行えば，

\begin{align}
-\left(\frac{N}{2\sigma^2} + \frac{1}{2\sigma_0^2}\right) \mu^2
&= -\frac{1}{2\sigma_N^2} \mu^2 \\
\left(\frac{\sum_{n=1}^N x_n}{\sigma^2} + \frac{\mu_0^2}{\sigma_0^2}\right)\mu &= \frac{\mu_N}{\sigma_N^2}\mu
\end{align}

が得られる．$\mu^2$に関する条件式から式(2.142)が得られる．

以下では，$\mu$の係数を比較していくが，式(2.141)に注目すると$\mu_{ML}$という項が入っている．これは，$\sum_{n=1}^Nx_n = N\mu_{ML}$という平均の定義式を用いて導入されるものである．以上に注意すれば，$\mu$の係数比較を通して以下が導かれる．

\begin{align}
\mu_{N} &=\sigma_{N}^{2} \left(\frac{\sum_{n=1}^{N} x_{n}}{\sigma^{2}}+\frac{\mu_{0}}{\sigma_{0}^{2}}\right) \\
&=\left(\frac{1}{\sigma_{0}^{2}}+\frac{N}{\sigma^{2}}\right)^{-1} \cdot\left(\frac{N \mu_{M L}}{\sigma^{2}}+\frac{\mu_{0}}{\sigma_{0}^{2}}\right) \\
&=\frac{\sigma_{0}^{2} \sigma^{2}}{N \sigma_{0}^{2} + \sigma^{2}} \cdot \frac{N \mu_{M L} \sigma_{0}^{2}+\mu_{0} \sigma^{2}}{\sigma^2 \sigma_{0}^{2}} \\
&=\frac{\sigma^{2}}{N \sigma_{0}^{2}+\sigma^{2}} \mu_{0}+\frac{N \sigma_{0}^{2}}{N \sigma_{0}^{2}+\sigma^{2}} \mu_{M L}
\end{align}

訂正前の解答

prml

アカデミック

【超初心者向け】これなら分かる！はじめてのLSTM

2020年4月5日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【初学者向け】情報セキュリティ＜マルウェア編＞

2019年8月1日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【Pythonお悩み解決】Pytorchのモデル更新を止めたい。

2020年5月2日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【Linuxお悩み解決】共同GPUサーバの使い方と心構え

2019年10月22日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

情報理論

【2020年版】元文系京大生がおすすめする最適化数学の参考書

2018年9月3日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【第３章線形回帰モデル】PRML演習問題解答を全力で分かりやすく解説＜3.18＞

2019年5月6日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

POSTED COMMENT

maki より:

2020年12月17日 4:59 PM

誤植（？）を見つけましたので報告します。
1行目の事後分布の指数部分ですが
以下のようになるのではないでしょうか？(latex形式ですみません。まちがっていたらすみません。)
\begin{align}
-\frac{1}{2\sigma^2}\sum_{n=1}^N(x_n-\mu)^2-\frac{1}{2\sigma_0^2}(\mu-\mu_0)^2
\end{align}

返信
- zuka より:
  
  2021年1月18日 11:39 AM
  
  maki様
  
  ご連絡ありがとうございます。
  ご返信が遅くなってしまい，大変失礼いたしました。
  
  （こちらで勝手にlatex形式をコンパイルしてしまいました。）
  $p(\mu)$に関するシグマが不必要ということでしょうか。
- maki より:
  
  2021年1月21日 8:25 AM
  
  zuka様
  
  お返事ありがとうございます。
  
  >>p(μ)に関するシグマが不必要ということでしょうか。
  はい、そのように思います。
- zuka より:
  
  2021年1月22日 11:55 AM
  
  maki様
  
  ご指摘ありがとうございます！！
  $\mu$はスカラーでしたね．それに伴ってガウス分布も1次元になります．ご指摘の通りでした．
  本文を修正いたしました．お時間のある際にご確認いただけますと幸いです．助かりました><
maki より:

2021年1月28日 8:06 AM

zuka様

>>お時間のある際にご確認いただけますと幸いです．
確認いたしました。
ご対応ありがとうございました。

返信