rinna

自然言語処理に関する最難関国際会議「ACL 2024」にrinnaの研究論文が採択

お知らせ

自然言語処理についての最難関国際会議である「The 62nd Annual Meeting of the Association for Computational Linguistics (ACL 2024)」に、LLMを活用した音声認識に関するrinnaの研究論文がFindingsとして採択されました。

Integrating Pre-Trained Speech and Language Models for End-to-End Speech Recognition

Yukiya Hono, Koh Mitsuda, Tianyu Zhao, Kentaro Mitsui, Toshiaki Wakatsuki, Kei Sawada (rinna)

[論文]

rinnaはこれまで日本語のタスクに適したGPT・BERT・HuBERT・CLIP・Stable Diffusionなど、テキスト・音声・画像に関する事前学習済み基盤モデルを公開してきました。この論文では、これまでに公開した事前学習済みHuBERTとGPTを統合して音声認識を実現するモデルを提案し、日本語音声認識での実験結果をまとめています。

rinnaはこれからも誰もがAIを活用できる「AIの民主化」を目指して、研究開発に勤しんでまいります。

関連記事