ホームchevron_rightニュースchevron_rightニュースリリースchevron_rightAmiVoice® 音声認識APIに双方向型のディープラーニング技術「Bi-LSTM」を実装 領域特化型エンジンの認識率が大幅向上

AmiVoice® 音声認識APIに双方向型のディープラーニング技術「Bi-LSTM」を実装領域特化型エンジンの認識率が大幅向上

株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」をアップデートし、双方向型のディープラーニング技術「Bi-LSTM(Bidirectional Long Short-Term Memory)」を音声認識エンジンに実装しました。これによりエラー改善率が最大で25%(当社調べ)と、自然発話を中心とした認識率が大幅に向上しました。


https://acp.amivoice.com/main/

Bi-LSTMは、ディープラーニングの発展技術の一つです。従来の音声認識エンジンAmiVoiceに実装していた、リカレントニューラルネットワーク技術の「LSTM(Long Short-Term Memory)」は、過去の情報を加味しながら処理を行いますが、「Bi-LSTM」は未来の情報を予測し加える事で、双方向の時間軸から処理を行います。その為、更に高い認識率を実現する事が可能になりました。

この度「AmiVoice Cloud Platform」で提供している、全ての領域特化型の音声認識エンジンに「Bi-LSTM」を実装しました。「LSTM」を実装したこれまでの音声認識エンジンと比較し、リアルタイム認識で最大20%、バッチ認識で最大25%のエラー改善率となり、認識率が大幅に向上しました。


【Bi-LSTMを搭載した音声認識API】



汎用向け

汎用エンジン

※4月1日に「Bi-LSTM」を実装済み



医療向け

医療_汎用エンジン、医療_介護エンジン、医療_電子カルテエンジン、医療_調剤エンジン


会議向け

会議_議事録エンジン


業務報告向け

業務報告_金融エンジン、業務報告_製薬エンジン、業務報告_保険エンジン



AmiVoice Cloud Platform



WEB

https://acp.amivoice.com/main/



概要

クライアントアプリケーションに特別なライブラリを組み込む事なく、音声認識機能を実装できる音声認識APIです。音声文字化や音声対話、音声制御、音声翻訳等、アプリケーション、Webサイト等の各種サービスにご使用いただけます。汎用エンジンに加え、医療向け・会議向け・業務報告向けの領域特化型エンジンを提供しています。汎用エンジンは、毎月60分無料で使用ができます。また、各エンジンは体験デモ(

https://acp.amivoice.com/main/acp-demo/

)でお試しいただけます。

アドバンスト・メディアでは、「AmiVoice Cloud Platform」を軸とした音声認識のオープンプラットフォーム化を進めております。AmiVoice 音声認識APIをご利用いただく事で、従来の音声認識開発に要する時間を大幅に短縮するとともに、高い認識精度の音声認識エンジンを簡単に組み込む事が可能になります。

今後も、様々な領域特化型の音声認識APIの公開や随時アップデートを継続していきます。

以上

本件のお問い合わせ

経営推進本部 広報チーム

TEL:03-5958-1307
FAX:03-5958-1032

この報道内容についてのお問い合わせ

PF D&O部

TEL:03-5958-1034
FAX:03-5958-1033

この製品についてのお問い合わせ

国内シェアNo.1国内シェアNo.1AmiVoiceⓇAmiVoiceⓇ

※出典:合同会社ecarlate「音声認識市場動向2024」
ソフトウェア/クラウドサービス市場

声で書く、声で動かす。
AI音声認識AmiVoiceは、
さまざまなビジネスシーンで、
人とキカイの自然なコミュニケーションを実現する技術です。