アカデミック

【超初心者向け】ドラム採譜論文要約「Drum transcription from polyphonic music with recurrent neural networks」

この記事では,研究のサーベイをまとめていきたいと思います。ただし,全ての論文が網羅されている訳ではありません。また,分かりやすいように多少意訳した部分もあります。ですので,参考程度におさめていただければ幸いです。

間違えている箇所がございましたらご指摘ください。随時更新予定です。他のサーベイまとめ記事はコチラのページをご覧ください。

【まとめページ】研究サーベイ記事一覧 和訳記事 ●Attentionを用いたseq2seqのメカニズム●イラストでみるTransfomer 機械学習 基本...

参考文献は最後に記載してあります。

本論文を一枚の画像で

落合先生の雛形(先端技術とメディア表現[外部リンク])を活用させていただきました。

要旨

ソロ信号・ポリフォニック信号からRNNでドラム採譜するネットワークを提案。ドロップアウトをしたり,パートごとにlossの重みを変えたりすることでSDとHHを重点的に学習。SOTAに勝る性能を発揮。

提案手法

提案手法の流れ

2層GRUとlabel-time-shiftを利用。ドロップアウトやlossの重みづけなども行う。

実験・評価

最高性能を達成。()内の数字は交差バリデーションを行なって最適化されたモデルを使用した場合。
閾値とF値の関係。0.10-0.15程度が良いとわかる。

結論

RNNネットワークの構造はGRUでlabel time shiftを活用した。他にも,ドロップアウトやData Augmentationを駆使して性能を引き上げた。結果として,従来のSOTAを超える精度を叩き出した。RNNはポリフォニック信号に対して柔軟なモデルだといえる。

まとめ

ポリフォニック信号に対してドラム採譜でRNNを使ってみようという研究でした。

参考文献

Vogl, Richard, Matthias Dorfer, and Peter Knees. “Drum transcription from polyphonic music with recurrent neural networks.” 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2017.

ABOUT ME
zuka
京都大学で機械学習を学んでいます。

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

※ Please enter your comments in Japanese to prevent spam.