多話者多言語音声合成のデモ音源

「多話者多言語音声合成」とは、1つのAI（音声合成モデル）から、複数話者と複数言語の音声を合成する技術です。
従来、AIキャラクターの音声合成を実現するためには、対象の話者の音声を大量に収録する必要がありました。新たに開発した多話者多言語音声合成では、複数の話者の音声を用いて1つの音声合成モデルを学習することで、複数の話者・言語の音声を合成することができます。それによって、対象の話者の少量の音声からでも、その話者のキャラクター性を持った音声を合成することができます。
さらに、日本語と英語といった複数の言語の音声も含めて1つの音声合成モデルを学習することで、英語が話せない話者のキャラクター性を保ったまま、英語の音声を合成することも可能となります。