ホームchevron_rightニュースchevron_rightニュースリリースchevron_right声紋認証技術で話者推定機能を実現した「AmiVoice 議事録作成支援システム」発売~地方議会や民間企業で導入されているシステムに、更なる効率化に貢献する新機能を搭載~

声紋認証技術で話者推定機能を実現した「AmiVoice® 議事録作成支援システム」発売

地方議会や民間企業で導入されているシステムに、更なる効率化に貢献する新機能を搭載

株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役社長:鈴木清幸以下、アドバンスト・メディア)は、2004年から発売している音声認識技術を活用した「AmiVoice®議事録作成支援システム」に、発言者の声の特徴から個人を特定し自動的に発言者の名前が入力される、話者推定機能などを追加し、議事録作成の飛躍的な効率向上に貢献するシステムとして、2007年10月より発売いたします。

AmiVoice® 議事録作成支援システム」は、2004年6月に静岡県沼津市議会にて導入されて以来、北海道議会などの地方議会や、多くの企業様にご採用いただいたシステムです。音声認識技術AmiVoice®ならではの、使用する人の声や話し方の特徴を事前に学習させる必要がない「不特定話者」対応や、各ユーザ様に合わせたカスタマイズをすることで高い認識率を実現し、議事録作成を強力に支援するシステムとして好評をいただいております。今回は、既存ユーザ様の要望を基に、議事録作成作業の更なる効率化に実現する新たな機能を搭載しました。中でも、声紋認証技術を活用し、発話者の声の特徴から発話者を特定する話者推定機能は、議事録作成システムでは初めて搭載された機能です。従来のシステムでは、議事録作成者が録音音声から話者を判断し入力する手間がありましたが、この話者推定機能によって、議事録をよりスピーディーに作成でき、作成時間や費用の大幅カットに貢献いたします。


主な製品機能

【1:話者推定機能】

当社の「声紋認証技術*1)」を活用し、発言者の声の特徴から個人を特定する機能です。話者推定機能を搭載することで、発言者の名前が自動的に入力され、議事録をより効率的に作成できます。

【2:標準用字用例辞典に準拠した変換機能を強化】

従来システムにおいても正しい表記の辞書を提供しておりましたが、今回は議事録作成者が参照している「標準用字用例辞典」に準拠し、認識用辞書と言語モデル*2)の強化を図りました。この強化により、認識結果を自動的に用字用例に準拠して表記します。

(例:挨拶  ⇒  標準用字用例辞典では  「あいさつと表記)

【3:導入先設備に合わせた音響モデルアダプテーション】(オプションサービス)

導入施設(会議室など)の音響特性が音声認識精度の低下をもたらす場合、音響モデル*3)を導入先の環境へ適応をさせることにより、認識精度の向上を図るサービスです。導入先設備に適した音響モデルにカスタマイズすることで、より高い認識精度を実現します。

アドバンスト・メディアは、この新機能を追加した「AmiVoice®議事録作成支援システム」を、地方議会や民間企業での議事録作成を強力に支援するサービスとして拡販してまいります。また、今後1年間で2億円の売上を目標としております。当社は、今後も音声認識技術AmiVoice® を活用した新しい企業向けサービスを拡大し、音声認識技術の利便性を幅広く提供することで新しい未来を拓いてまいります。

*1)『声紋認証技術』

声紋認証技術とは、アドバンスト・メディアが開発した個々人の声の特徴である「声紋」を利用した生体認証です。声紋は指紋のように個人ごとに異なる特徴を持つため、それを基に個人を識別することが可能です。当社では、声紋認証技術を活用した製品として、オフィス向け入退室管理システム「AmiVoice Guard」、集合住宅向けエントランス開閉システム「開けドアシステム」、携帯電話を介した声紋認証システム「AmiVoice Mobile Verification」を展開していますが、これらのシステムでは音声認識技術によるキーワードチェックを掛け合わせることでより強靭なセキュリティレベルを実現しています。

*2)『言語モデル』

言語モデルとは、単語がどのような文脈で使用されるかを記述した文法です。ここでは大量のテキストを分析してそれぞれの単語について出現確率・接続確率をデータ化した統計文法を用いています。文章中で連続する「3単語」の出現頻度を元に接続確率を計算します。例えば、「私は医師です」と発話された場合には、「私」と「は」の次に来る単語は「石」や「意思」よりも、「医師」である確率が高いと推定します。

*3)『音響モデル』

音響モデルとは、入力された音声を分析して得られた音響的「特徴量」から発音記号を推定するしくみです。ここでは大量の音声信号とラベリングされた発音記号から統計的に学習した不特定話者の音響モデルを使用しています。

国内シェアNo.1国内シェアNo.1AmiVoiceⓇAmiVoiceⓇ

※出典:合同会社ecarlate「音声認識市場動向2024」
ソフトウェア/クラウドサービス市場

声で書く、声で動かす。
AI音声認識AmiVoiceは、
さまざまなビジネスシーンで、
人とキカイの自然なコミュニケーションを実現する技術です。