事前学習なしで音声から発話者を推定する「話者ダイアライゼーション」が、AI音声認識開発キット「AmiVoice® SDK」の無料オプションとして利用可能に

2024.01.23

開発者向けボイステックプラットフォーム「AmiVoice Cloud Platform」で提供しているAI音声認識開発キット「AmiVoice SDK」の無料オプションとして「話者ダイアライゼーション」機能が利用できるようになりました。

話者ダイアライゼーションは、複数の話者が含まれる音声に対して、誰がいつ話したのかを推定する技術です。アドバンスト・メディア独自開発の音響モデルを用いて、事前学習なしで音声から発話者を推定し、発言内容と発話者を自動的に紐づけます。会議や対面営業、面談、動画への字幕付与など、複数人が話をするシーンでご利用いただけます。

この度、AI音声認識開発キット「AmiVoice SDK」で話者ダイアライゼーションが利用できるようになりました。オフライン環境で話者ダイアライゼーション機能をご利用いただけます。

AmiVoice SDKの特長

1．オフラインで利用可能。よりセキュアな運用を実現
スタンドアローンで動作可能なため、医療現場などセキュリティの観点からインターネットに接続することが難しい環境下においても、音声認識機能をご利用いただけます。

2．ノイズに強いエンジン。屋外や工場向けのアプリ開発に
カスタマイズ性が高く、現場に合わせた認識パラメータの調整や単語登録による専門用語の認識が可能です。製造業の現場や屋外での点検保守業務などで利用する機器への組込みやアプリ開発でも活用されています。

3．単語・コマンド認識も可能。音声入力や音声操作にも
製品名と数の組み合わせや、数値やアルファベット、「異常なし」のようなコマンドワードなどの認識（ルールグラマ認識）を得意としています。もちろん文章も高精度で認識します。

4．豊富なサポートメニューで安心して開発できる
「AmiVoice SDK」の利用方法に関する技術的なお問い合わせに対し、①技術スタッフが直接 ②日本語でサポートします。ご希望に応じて利用方法に関する講習も行っています。

■AmiVoice SDK 詳細

https://acp.amivoice.com/amivoice_sdk/

AmiVoice Cloud Platformとは

音声認識を中心とした音声関連技術を提供する開発者向けボイステックプラットフォームです。国内シェアNo.1^※の高精度かつ高速なAI音声認識AmiVoiceを、業界最安値の1時間99円（税込）～で利用できる「AmiVoice API」に加え、音声認識開発キット「AmiVoice SDK」を提供。クラウド/オンプレミス、リアルタイム/バッチなど、目的に合わせて最適なインターフェイスを選択できます。

また、Amazon Connectを利用したコンタクトセンター製品開発者向けサービスもご利用可能です。

■AmiVoice Cloud Platform 詳細

https://acp.amivoice.com/

※出典：ecarlate「音声認識市場動向2023」音声認識ソフトウェア/クラウドサービス市場

本件のお問い合わせ

SDX事業部

この製品についてのお問い合わせ