読者の皆様へ。Beginaidは生まれ変わります

アカデミック

【超初心者向け】ドラム採譜論文要約「Recurrent Neural Networks for Drum Transcription」

zuka 2019年11月2日

この記事では，研究のサーベイをまとめていきたいと思います。ただし，全ての論文が網羅されている訳ではありません。また，分かりやすいように多少意訳した部分もあります。ですので，参考程度におさめていただければ幸いです。

間違えている箇所がございましたらご指摘ください。随時更新予定です。他のサーベイまとめ記事はコチラのページをご覧ください。

【まとめページ】研究サーベイ記事一覧和訳記事 ●Attentionを用いたseq2seqのメカニズム●イラストでみるTransfomer 機械学習基本...

参考文献は最後に記載してあります。

読みたい場所へジャンプ！

本論文を一枚の画像で
要旨
提案手法
実験・評価
今後の課題
まとめ

本論文を一枚の画像で

落合先生の雛形（先端技術とメディア表現[外部リンク]）を活用させていただきました。

要旨

初めて「ドラム」採譜にRNNを利用した研究。SOTAよりも高いF値を達成しながらも，汎化性能を期待させる結果が得られた。

提案手法

4つのRNNアーキテクチャを試す。「前向きRNN」「後ろ向きRNN」「双方向RNN」「タイムシフトRNN」

実験・評価

今回の実験ではオンセット時刻の許容誤差は20msとしている。SOTAの手法はもっとゆるい基準（30msや50ms）。

tsRNNでSOTA達成。NMFは対象のデータに含まれるような基底を用意する必要があるがRNNはない。そのような観点からも汎化性能が期待される。bwの方が通常のRNNよりも性能が良かったのは残響の情報を利用できたからであろう。

RNNは現在のSOTAを上回りはしなかったが，それは当然。HMMではENST-Drumsデータセットを分割して学習・テストを行なっているが今回はIDMT-SMT-Drumsで学習したモデルを利用して汎化性能を調べているから。それなりに妥当なF値を出力していることが伺える。

今後の課題

ポリフォニック音源に対応させること。多くのパートに対応させること。そのためには多くのパートが十分な回数出現するようなデータセットを作ることが先決。

まとめ

ドラム採譜に初めてRNNを適用した研究でした。

参考文献

Vogl, Richard, Matthias Dorfer, and Peter Knees. “Recurrent Neural Networks for Drum Transcription.” ISMIR. 2016.

アカデミック

【第６章カーネル法】PRML演習問題解答を全力で分かりやすく解説＜6.8＞

2019年6月3日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

【2020年版】元文系京大生がおすすめする情報理論の参考書

2018年9月5日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【Pythonお悩み解決】Lossは減るけど急にNanに飛んでしまう。

2019年10月22日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【第１章序論】PRML演習問題解答を全力で分かりやすく解説！＜1.2＞

2019年4月20日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【第７章】PRML演習問題解答を全力で分かりやすく解説＜7.12＞

2019年6月8日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

アカデミック

【第１章序論】PRML演習問題解答を全力で分かりやすく解説！＜1.7＞

2019年4月20日 zuka

https://tips-memo.com/wp-content/uploads/2019/09/252c30818e897f67b32380fd9d6acc11.png Beginaid

COMMENT コメントをキャンセル