プロジェクトオーガナイザの吉田聖書です。
今日は、4月23日にリリースされた音声合成のWebサービス
「CoeFont STUDIO」を取り上げます。
音声合成の技術そのものは昔からありますが、
汎用的な音声合成だと、
いかにも機会が読み上げましたという無機質な印象を受けます。
それが、ディープラーニング(深層学習)によって
人間らしい声を再現したということです。
おそらく人間の声をたくさん学習させたのでしょう。
そして、さらにそれをWebサービス化して、
無料で公開されました。
開発したのは株式会社Yellston(東工大発のベンチャーのようです)で、
4月23日にWebサービス『CoeFont STUDIO』の公開とともに
プレスリリースを出しています。
代表の早川さんはなんと19歳の東工大生です。
私と同じ理系です。
https://prtimes.jp/main/html/rd/p/000000001.000078329.html
「すべてのクリエイターに声を届ける」Web音声合成サービス『CoeFont STUDIO』が無料で公開を開始!
プレスリリースには、
「CoeFont STUDIOのリリースを記念し、
全サービスを期間限定で無料で公開いたします。」
とあり、かつ、終了時期は未定とのことで、
最初はいろんな可能性を探っていくのだと思われます。
このような基礎技術は応用範囲が広いので、楽しみですね。
声フォント(CoeFont)っていうネーミングがいいですよね。
フォントは同じ文字でも様々に表現を変えられますが、
それと同じように、
同じテキストを声フォントを差し替えることで
様々に表現を変えられるということを
イメージしているのだろうと推測します。
実際にログインしてみると分かりますが、
「CoeFont STUDIO」の画面はシンプルです。
最初はテキストを入力するだけの画面が表示され、
声は2種類からプルダウンで選べるようになっています。
※ この記事は、先日公開した以下の音声コンテンツを基に編集したものです。
上記の音声コンテンツでは、
実際に『CoeFont STUDIO』を使って再生した音声を収録しています。
思ったよりニヒルな感じがしますが、
よく耳にするような機械的な感じはしないです。
ちなみに、テキストを入力して音声に変換すると、
テキストの読み方とかイントネーション、
それから発声のスピードとか声の高さを
変えられるようになっています。
デフォルトの状態だと標準語のような発音になりますが、
イントネーションを変更すれば
方言のような発音に近づけることができます。
別のある音声合成サービスでは
イントネーションは3段階だった記憶があるのですが、
この『CoeFont STUDIO』では2段階、
高いか低いかしか設定できません。
個人的には3段階あった方が表現が豊かになると思いますが、
これは今後いくらでも対応は可能なレベルではないかなと思います。
このようなサービスは、
実際のコンテンツに使っても良いと思いますが、
最初からナレーターをアサインするとコストがかかるので
プロダクト版制作前の試作やプレゼンに使うと
コストを抑えられて良さそうだ思いました。
手元にあるテキストをしゃべらせるだけでも楽しいので、
興味のある方は試してみてください。
https://coefont.studio/
CoeFont STUDIO
関連記事
プロマネの右腕
プロジェクトマネジメントの支援を行っています。
新サービスの企画を任されたけど どう進めていいか悩んでいる担当者、
部下に新しい企画を任せたけど このままで大丈夫か不安な管理職の方、
以下のサイトをご参照ください。
https://www.crossidea.co.jp/services/right-hand-pmo.html
YouTubeにて動画配信中!
プロジェクトマネジメントのノウハウをYouTubeで配信しています。
ブログと併せてご活用ください。