アカデミック

【超初心者向け】MIR論文要約「The harmonix set: beats, downbeats, and functional segment annotations of western popular music」

この記事では,研究のサーベイをまとめていきたいと思います。ただし,全ての論文が網羅されている訳ではありません。また,分かりやすいように多少意訳した部分もあります。ですので,参考程度におさめていただければ幸いです。

間違えている箇所がございましたらご指摘ください。随時更新予定です。他のサーベイまとめ記事はコチラのページをご覧ください。

【まとめページ】研究サーベイ記事一覧 和訳記事 ●Attentionを用いたseq2seqのメカニズム●イラストでみるTransfomer 機械学習 基本...

参考文献は最後に記載してあります。

本論文を一枚の画像で

落合先生の雛形(先端技術とメディア表現[外部リンク])を活用させていただきました。

要旨

ビート・ダウンビート・セグメントのアノテーションを付与した大規模なデータセットを公開した研究。曲数は912にも及ぶ。

データセット

YoutubeからPOPs(と彼らが判断した)楽曲を収集して,プロの専門家が「Beat」「Down beat」「Segment」のアノテーションを付加。データセットはこちらのURLから筆者らのGithubにアクセスできる。論文中にも言及がある通り,元々のモチベーションの対象が「ゲーム音楽」であるため,EDM寄りの音楽が多いことに注意。現在公開されている中で最も規模の大きいデータセットです。

統計的情報

収録されている曲のジャンル
各テンポの曲数
ビートの長さの標準偏差
all segmentsは単純なセグメント数。Unique segmentsは同じ種類のセグメントを1つにまとめた数。
セグメントのラベルの種類
セグメントの長さ[s]

まとめ

Beat推定やダウンビート推定に利用できる有用なデータセットでした。

参考文献

Nieto, Oriol, et al. “THE HARMONIX SET: BEATS, DOWNBEATS, AND FUNCTIONAL SEGMENT ANNOTATIONS OF WESTERN POPULAR MUSIC.”

ABOUT ME
zuka
京都大学で機械学習を学んでいます。

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

※ Please enter your comments in Japanese to prevent spam.