rinna

法人向けサービス

音声とフェイスモーションの生成AIサービス

Koemotion

Koemotion(コエモーション)は、AIによるテキスト読み上げ機能に、フェイスモーションの生成やシーンにあわせた感情選択・感情予測機能が加わった音声合成サービスです。

Koemotionは、サービス名に含まれている「コエ」「エモーション」「モーション」を扱う生成AIサービスです。Koemotionサービスの音声合成は、従来の音声合成製品のように事前に用意された特定の話者の音声を合成するのではなく、2次元空間(話者マップ)から任意の座標を選択することで話者の声色を多種多様に変更して音声を合成することができます。

Koemotionの特長

  • Koemotionは、入力したテキストの感情予測・音声の合成・フェイスモーションの生成ができます。
  • 106話者から収録した約110時間の音声を用いて、話者の声色を表現する2次元の空間(話者マップ)が学習されています。この話者マップから任意の座標を選択することで、106話者の中間的な話者の声色も合成することができます。
  • 全ての話者の声色で通常・喜び・悲しみ・怒り・恐れ・驚き・囁きの7種類の音声を選択でき、話者マップとの組み合わせで様々な音声を合成することができます。
  • 入力されたテキストに込められた感情を推定する機能もあり、感情に合わせた発話スタイルで読み上げることもできます。
  • 合成された音声に合わせたフェイス(顔)のキーポイントを3次元座標のモーションとして生成します。2D・3Dモデルや画像生成AIと組み合わせることでキャラクターの表情を音声と同期させて動かすことができます。
  • Webブラウザで動作する2次元マップのユーザーインターフェースを提供しており、好きな声を見つける楽しみを体験できます。
  • Webブラウザで提供するユーザーインターフェースに加えAPIリクエストによる呼び出しも可能です。個人・法人向けに利用目的に合わせたプランを選択できます。