ホームchevron_rightニュースchevron_rightニュースリリースchevron_rightアドバンスト・メディアの音声認識エンジン「AmiVoice DSR」富士通製プロセッサ「FR-V/Linux」に実装

アドバンスト・メディアの音声認識エンジン「AmiVoice DSR」富士通製プロセッサ「FR-V/Linux」に実装

音声認識・認証事業を専門とする株式会社アドバンスト・メディア(以下アドバンスト・メディア、本社:東京都豊島区、代表取締役社長 鈴木清幸)は、富士通株式会社(以下富士通、本社東京都千代田区、代表取締役社長 秋草直之)の製品であるVLIW型プロセッサ「FR-V」(OSはLinux)に、サーバクライアント型日本語音声認識エンジン「AmiVoice DSR(Distributed Speech Recognition)」のフロントエンドを実装しました。「FR-V」向けのミドルウェアとして2003年4月下旬より発売(対応を開始)します。

音声認識エンジン「AmiVoice DSR」が、「FR-V」に組込まれることにより、このプロセッサが展開されるモバイル機器・デジタル家電市場において、同時に、高精度なセンター型音声認識を実現できるようになります。これまではモバイル・ワイヤレスの環境下で困難であった、データエントリーやナビゲーション、機器コントロールなどを、リアルタイム処理の音声による簡単な入力で行えるようになるため、新たな市場展開が期待できます。

アドバンスト・メディアの「AmiVoice DSR」は、音声認識処理のフロントエンド処理である音響分析処理部分を分割し、クライアント端末側で稼動させるものです。音響分析後の音声データは元のデータに比べて約1/30のサイズとなるため、リモート/センター間がAirH”やP-in等のナローバンドの回線であっても高品質の音声(16KHzサンプリング、16ビットデータ)を認識サーバへ渡すことが可能となります。 また、音声データの送信はTCP/IP通信であるため、通信パケットのロスや回線ノイズの影響による音声品質の劣化が回避されます。音声品質の向上とセンターサーバによる高速処理のため、従来方式に比べて認識率が飛躍的に向上します。さらには、音声認識処理の負荷を分散できることからユビキタス環境を見据えた大規模システムの構築も可能となります。

富士通の「FR-V」は、世界最高レベルのリアルタイム性能を持つプロセッサで、割込みの発生から割込み処理プログラムが起動されるまでの応答時間はベストケースでは1マイクロセカンド(.s)以下の高速性を達成し、最長でも34.sと、従来の他社製リアルタイムOSよりもはるかに高い性能を持つものです。デジタル家電、モバイル製品などにおける高性能なマルチメディア処理を低消費電力で実現でき、次世代モバイル端末の中心となるCPUとして期待される製品です。

アドバンスト・メディアは今後、モバイルでの音声対応アプリケーションのサービスモデルを独自に開発・提供し、自ら音声市場の拡大に対し積極的な展開を図って行きます。この「FR-V」への「AmiVoice DSR」のフロントエンドの実装は、その大きな原動力となるものです。

【商品についてのお問い合わせ】

株式会社アドバンスト・メディア
営業本部

TEL:03-5958-1091
FAX:03-5958-1033

Email

info@advanced-media.co.jp

【報道関係のお問い合わせ】

株式会社アドバンスト・メディア
経営企画部 広報・IR室 広報担当 植村恵子

TEL:03-5958-1091
FAX:03-5958-1033

Email

press@advanced-media.co.jp

国内シェアNo.1国内シェアNo.1AmiVoiceⓇAmiVoiceⓇ

*出典:合同会社ecarlate「音声認識市場動向2024」
ソフトウェア/クラウドサービス市場

AmiVoiceのAI音声認識は、
音の情報と言語の情報を密接に組合せながら、
音声を「文字」に変換する技術です。