この記事は音MAD Advent Calender 2022に参加しています
adventar.org
こちらの企画に参加させていただけることになったので、新しくBlogを作りました。今後どんな記事を書くかは全然決めていないですが、たまに編集後記とかを残す場所にできればと思ってます。
記事の内容3行まとめ
- MAD素材の切り分けや文字起こしの作業って大変ですよね。
- なので、音声・動画の切り分けを自動でやってくれるツールを作ってみました。
- Google Colaboratoryから動かせるようにしたので使ってみてね!
- はじめに
- 作ったものの紹介
- 使い方
- 実際にMAD制作に使ってみた感触
- 最後に
- 追記(2023/02/26)
- 追記(2024/02/05)
とりあえず使ってみたいって人は3.使い方の章だけ見てもらえれば大丈夫です。
はじめに
初めて使うジャンルの素材で音MADを作ろうとしたときに、スターターパック的なものが用意されていると作りやすいですよね。
音声ファイルは使いやすいようにファイル名がつけてあったり、キャラごとにフォルダ分けされてあったり、よく使われる素材がまとめてあったりするので、スターターをダウンロードさえしてしまえばすぐに音声や動画の編集を始めることができます。
ただ、当然どんな素材でもスターターパックがあるなんてことはなく、むしろ用意されていない素材の方が多いくらいです。
ある程度型が決まっている素材や、CM素材のように尺が短いものであれば、元動画からそのまま音MADを作っていくことはできるかと思います。
こちらの四角さんの記事で紹介されていたような「ストーリー系MAD」みたいなものを作ろうとすると、構成をしっかり組むために大量の素材を整理する作業が必要になってきます。
note.com
自分も過去に少女終末旅行の音声素材切り分けに挑戦してみたことがあるのですが、作業が退屈すぎる&飽き性なこともあって1話分やった時点で断念しちゃいました…。
冷静に考えて、1クール分のアニメ本編=約4時間ほどの素材に対して、ちょうどいい長さで分割、セリフの文字起こしをしてファイル名をつける、発言しているキャラごとに分類する、みたいな作業をちゃんとやろうとすると平気で数日はかかります。
常人には無理だろ…って思ってたのですが、こちらの竹塔さんの記事では実際にごちうさ12話分+劇場版の音声切り分け作業をやった例が紹介されています。凄すぎる。
改めて、スターターパックを用意してくれる人には頭が上がらないですね。
taket-a.hateblo.jp
そんな中、今年2022年の9月にOpen AIからWhisperという音声認識AIが発表されました。
github.com
Whisperは音声から文字起こしをやってくれるAIで、これまで存在していた音声認識ソフトとは比べ物にならない精度で音声認識ができます。
これを使えばMAD素材の音声切り分け作業がほぼ自動化できるようになるのでは…?と思い、いろいろ試してみました。
ということでこの記事では、アニメやソシャゲなど元の動画が数時間もあるような素材を使おうとした時に、素材の切り分け作業をできるだけ自動化してみようとして自分が作ったものについて紹介していきたいと思います。
いろいろと調べていく中で、音声だけじゃなくて動画の切り分けもできそうだったのでこっちも合わせてツール化してみました。
続きを読む