長時間の通話録音や会議音声などをバッチ認識でスピーディーに文字化
株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)は、音声認識APIを提供する開発プラットフォーム「AmiVoice Cloud Platform(アミボイス クラウド プラットフォーム)」をアップデートし、「非同期HTTP音声認識API」をリリースしました。10月8日(金)よりご利用いただけます。
AmiVoice 音声認識APIは、クライアントアプリケーションに特別なライブラリを組み込むことなく、簡単に音声認識機能をWEBサイトやアプリケーションに実装できます。
これまで提供していたリアルタイム音声認識用の「WebSocket音声認識API」とバッチ音声認識用の「HTTP音声認識API」に加え、新たに「非同期HTTP音声認識API」をリリースしました。「HTTP音声認識API」の制限である16Mbytes以上のファイルも一括で音声認識可能になるため、コンタクトセンターの通話音声、会議音声、動画・ラジオ・YouTubeの音声など、長時間の音声データをまとめて文字化することに適しています。複数ファイルの非同期処理をまとめて行うため、音声ファイルのサイズや長さに関わらずスピーディーに認識結果を得ることができます。
■WebSocket音声認識API | 音声ストリームをリアルタイムでテキスト化することができます。 <利用用途> ・コンタクトセンターの会話をリアルタイムにテキスト化 ・会議の発言をリアルタイムにテキスト化 ・スマートフォンやIoTデバイスの音声操作 ・音声対話システム |
■同期HTTP音声認識API | 音声ファイルをテキスト化することができます。短い音声ファイルに適しています。 <利用用途> ・音声メモや留守番電話など、短い音声ファイルのテキスト化 ・音声認識を使ったシステムのPoCや音声認識精度の評価 |
■非同期HTTP音声認識API | 音声ファイルをテキスト化することができます。長い音声ファイルや、大量の音声ファイルをテキスト化する用途に向いています。 <利用用途> ・コンタクトセンターの通話録音音声ファイルのテキスト化 ・会議録音音声ファイルのテキスト化 ・動画ファイルのテキスト化や字幕作成 |
3種類のAPIについては、「AmiVoice Tech Blog」にて詳細を記載しています。
https://amivoice-tech.hatenablog.com/entry/2021/10/08/
【「AmiVoice Cloud Platform」音声認識APIの特長】
1. 音声認識市場シェアNo.1
※
AmiVoice は20 年以上のノウハウ・データが蓄積された高精度かつ高速の音声認識エンジンです。ビジネスシーンや専門性の高い作業現場など幅広いシーンで使われています。
2. 1時間99円から。低価格で高品質な音声認識を利用可能
録音された時間ではなく発話のあった時間のみの従量課金制。課金単位も1秒単位で切り上げ計算なし。1時間99円~と、業界最低価格でありながら高品質な音声認識エンジンをご利用いただけます。
3. 業界や用途に合わせて選べるエンジンで高い認識率を実現
様々なシーンやビジネスで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンを用意しています。また、対面の会議や打ち合わせ、Web会議など、人同士の会話音声に強い会話用のエンジン、音声操作やメール作成など、PCやスマートフォンに対して行う音声入力に適したエンジンなど、利用シーンに合わせてエンジンを選ぶことで認識率が大幅に向上します。
AmiVoice Cloud Platform | |||
WEB | https://acp.amivoice.com/main/ |
アドバンスト・メディアは、今後も各種API・開発キットを積極的に公開・活用し、幅広いパートナーと共に、オープンイノベーションの推進と新たな利用シーン創出に向けた取り組みを拡大してまいります。
※出典:ITR「ITR Market View : AI市場2021」音声認識市場ベンダー別売上金額シェア(2015~2021年度予測)
以上