アカデミック

【超初心者向け】ドラム採譜論文要約「Automatic Drum Transcription Using the Student-Teacher Learning Paradigm with Unlabeled Music Data」

この記事では,研究のサーベイをまとめていきたいと思います。ただし,全ての論文が網羅されている訳ではありません。また,分かりやすいように多少意訳した部分もあります。ですので,参考程度におさめていただければ幸いです。

間違えている箇所がございましたらご指摘ください。随時更新予定です。他のサーベイまとめ記事はコチラのページをご覧ください。

【まとめページ】研究サーベイ記事一覧機械学習 基本的なモデル ●線形回帰 ●自己回帰 ●ガウス過程 ●ガウス過程と深層学習 ●ランク学習 言語処理 ●LDAとは? ●Dep...

参考文献は最後に記載してあります。

本論文を一枚の画像で

落合先生の雛形(先端技術とメディア表現[外部リンク])を活用させていただきました。

要旨

Student-Teacher学習でデータ不足を補おうという話。学習済みモデル(Teacher)の出力を教師データ(Hard-targets)の代わりにラベルとして採用(Soft-targets)することで,ラベル付き学習データの不足を補おうという発想。

提案手法

student-teacher学習の概念図
TeacherモデルにはNMFの拡張であるPFNMFを利用。学習データから基底行列(テンプレート)を抽出してテストデータの基底として利用。ドラム以外のテンプレートは最適化される。

StudentモデルはDNNを利用する。

実験・評価

実験結果。PFNMFをTeacherとしてStudentモデルを訓練。SD以外はDNNのStudentモデルが最高性能。
ジャンルごとにStudentモデルの性能を評価した実験。全てのジャンルを学習した方が性能がよい傾向にあることから,学習データには色々なジャンルを含ませた方がよいことが示唆される。これはboostingが起こっていると考えられる。

結論

ラベルなしデータを有効活用するポテンシャルが確認できた。また,データセットには複数のジャンルを入れた方がよい性能を引き出せることが示唆された。

まとめ

ラベル付きデータの不足を補うためのstudent-teacher学習の提案でした。

参考文献

Wu, Chih-Wei, and Alexander Lerch. “Automatic Drum Transcription Using the Student-Teacher Learning Paradigm with Unlabeled Music Data.” ISMIR. 2017.

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です