株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」をアップデートし、双方向型のディープラーニング技術「Bi-LSTM(Bidirectional Long Short-Term Memory)」を音声認識エンジンに実装しました。これによりエラー改善率が最大で25%(当社調べ)と、自然発話を中心とした認識率が大幅に向上しました。
https://acp.amivoice.com/main/
Bi-LSTMは、ディープラーニングの発展技術の一つです。従来の音声認識エンジンAmiVoiceに実装していた、リカレントニューラルネットワーク技術の「LSTM(Long Short-Term Memory)」は、過去の情報を加味しながら処理を行いますが、「Bi-LSTM」は未来の情報を予測し加える事で、双方向の時間軸から処理を行います。その為、更に高い認識率を実現する事が可能になりました。
この度「AmiVoice Cloud Platform」で提供している、全ての領域特化型の音声認識エンジンに「Bi-LSTM」を実装しました。「LSTM」を実装したこれまでの音声認識エンジンと比較し、リアルタイム認識で最大20%、バッチ認識で最大25%のエラー改善率となり、認識率が大幅に向上しました。
【Bi-LSTMを搭載した音声認識API】
汎用向け | 汎用エンジン ※4月1日に「Bi-LSTM」を実装済み |
医療向け | 医療_汎用エンジン、医療_介護エンジン、医療_電子カルテエンジン、医療_調剤エンジン |
会議向け | 会議_議事録エンジン |
業務報告向け | 業務報告_金融エンジン、業務報告_製薬エンジン、業務報告_保険エンジン |
AmiVoice Cloud Platform | |||
WEB | https://acp.amivoice.com/main/ | ||
概要 | クライアントアプリケーションに特別なライブラリを組み込む事なく、音声認識機能を実装できる音声認識APIです。音声文字化や音声対話、音声制御、音声翻訳等、アプリケーション、Webサイト等の各種サービスにご使用いただけます。汎用エンジンに加え、医療向け・会議向け・業務報告向けの領域特化型エンジンを提供しています。汎用エンジンは、毎月60分無料で使用ができます。また、各エンジンは体験デモ( https://acp.amivoice.com/main/acp-demo/ )でお試しいただけます。 |
アドバンスト・メディアでは、「AmiVoice Cloud Platform」を軸とした音声認識のオープンプラットフォーム化を進めております。AmiVoice 音声認識APIをご利用いただく事で、従来の音声認識開発に要する時間を大幅に短縮するとともに、高い認識精度の音声認識エンジンを簡単に組み込む事が可能になります。
今後も、様々な領域特化型の音声認識APIの公開や随時アップデートを継続していきます。
以上