- 人力VOCALOID音声制作の準備にちょっと役立つかも?という感じのツールです。
- 文字列をひらがなにして入力すると、その中に含まれている音素を抽出してくれます。
概要
人力VOCALOIDの音声を作るとき、素材集めはできるだけ楽したいですよね。
このプログラムは、歌わせたい歌詞の文字列をひらがなで入力すると、その中に含まれている(日本語の)音素を教えてくれるというものになります。促音(っ)は無視されて拗音(きゃ、ふぁ など)は二文字で一音として扱われます。

やってることはシンプルな文字列処理です。
この歌詞を歌わせるには最低限どの音の素材を集めればいいのか、ということが分かるので、せっかく音素を切り出したけどこの音は使わなかった…みたいな徒労感がなくなると思います。
使い方
以下のリンクからアクセスできます。Google Colaboratoryで作っています。 colab.research.google.com
1.ひらがな変換(任意)
LYRIC_TEXTの欄に歌詞を入力してセルを実行。
※たまに誤変換もあるので注意。

ちっちゃな私 のラスサビの部分でテスト。
配布されている歌詞テキストなどからコピペできると楽。
2.音素検出
HIRAGANA_TEXTの欄にひらがなの文字列を入力してセルを実行。
ひらがな以外の文字が入っていてもエラーにはならないが、音素検出はされない。

最後に
上の実行例だと検出結果は全部で35音になりました。
減ったとはいっても集めるのはやっぱり大変ですね。
とはいえ、これさえ集めてしまえば音声作りに取り掛かれる、という目安にはなるので気持ち的には多少楽になるかもしれません。
例によってColab環境で作っていますが、GPUが必要な重たい処理でもないので実行環境のある人はローカルでも自由に改変できると思います。