機械学習を用いたヴォーカル音源について

投稿作品の試聴用の音源作成のため、機械学習を用いたヴォーカル音源を使用している。現在使っているのはCeVIO AISynthesizer V で、声はそれぞれ「さとうささら」と「Saki AI」のみを使用している。それぞれの音源について使ってみて思ったことなどを書いてみようと思う。

Sythesizer V

Synthesizer Vは、従来のサンプルベースの歌声合成とAIによる歌声とのハイブリッド方式の音源ということのようだけれど、ヴァージョンが上がるごとに声質のリアルさは向上しつつも、エディタの可編集性の高さを保持しているところが良い。以前のVOCALOIDのエディターと同じような感覚で、音楽的に編集し、調声できる、そのプロセスの中にAIが活かされているところが良いと思う。

手軽にリアルな歌声を生成するというような方向性も大事だけれど、手間をかけて作り込んでいく面白さというものも、やはりあってよいものだと感じさせてくれる。

CeVIO AI

CeVIO AIは、和歌の投稿のために使用している。Synthesizer Vが楽器としてのエディタという感覚を保持しているのに対して、CeVIO AIのエディタは、AIのためのGUIというような印象がいくらかあって、楽器という感覚にはいくらか距離を感じるけれども、ここ最近のヴァージョンアップでより直感的に編集できるように改善されているようでもある。

CeVIO AIの場合、歌い方をエディタで作っていくというよりは、ある程度出来上がった歌い方が提示されるという感じだ。自分の思うように歌い方を調整していくという点では、Synthesizer Vに分がある。構築された機械学習のモデルに基づいて生成される歌声であれば、それはそういうものかもしれない。本当に細部まで調整したいと思うなら、機械学習のモデルを作るところから始めなければならないだろうか。それは難しいが、将来的には、機械学習のモデル作成をこなす音楽家、みたいな人が出てきても良いかもしれない。

さて、そのCeVIO AIによって生成された歌声は、どのようなものであろうか。印象としては、音楽的な良さを持ちうる性能があるように感じられる。つまり、音楽性という概念を直感するような瞬間は、あるような感触はある。なるほど、歌い方そのもののエディットはしにくいかもしれないが、こちらで作った旋律線には、こちらで用意した旋律に対しては、AIの歌声なりにきちんと答えてくれる、音楽を作ってくれるという感じ、そのような面白さがある。機械学習と音楽の在り方として、この感じはありかもしれない。

Synthesizer V Saki AI の使用例

遊びをせんとや 『梁塵秘抄』より
もろこし唐なる唐の竹 『梁塵秘抄』より

CeVIO AI さとうささら の使用例

伊勢物語 その十二 第六十六~八十一段
伊勢物語 その十 第四十一~五十八段

機械学習を用いたヴォーカル音源について

コメントを残す

メールアドレスが公開されることはありません。

トップへ戻る