ホームchevron_rightニュースchevron_rightニュースリリースchevron_right日本初!高度な音声認識を実現する 分散型音声認識を携帯電話に実装

日本初!高度な音声認識を実現する 分散型音声認識を携帯電話に実装

株式会社アドバンスト・メディア(東京都豊島区、代表取締役社長: 鈴木清幸、以下アドバンスト・メディア)は、現行の性能の携帯電話に高度な音声認識を実現する分散型音声認識(Distributed Speech Recognition:DSR)を実装することに成功いたしました。

これまでにも携帯電話単体で、登録されている電話番号の音声検索や簡単な音声ゲームなどのコンテンツはありました。また、センターに電話をかけてコンピュータとの音声対話によるチケット予約などのサービスはありました。しかしながら使い易い、面白い、便利と言うには程遠く、残念ながら我々の生活に浸透しているとは言えませんでした。アドバンスト・メディアの携帯電話用DSRにより、今までは不可能であった画面を見ながらのナビゲーションの行き先入力、全国住所入力、駅経路検索の駅名入力、メール文章入力などの数万語レベルの音声認識が可能となり、携帯電話の情報端末としての用途範囲が飛躍的に拡がり、真のユビキタス・コンピューティングが実現できます。

アドバンスト・メディアの携帯電話用DSRでは、音声通話は一切利用せずに、音声データから音声認識に必要な特徴量だけを取り出し、サーバへパケット通信を利用して送信します。そのため、上述のチケット予約のような音声通話の音声認識に見られる、通信ノイズや通信状態による音声認識精度の低下がありません。しかもブラウザやアプリケーションと容易に連携可能なため、画面を見ながら音声入力したり、入力結果を目ですぐに確認したりする事が可能となります。このDSRを携帯電話に装備すれば、パケット通信網を利用して、高度な音声入力を効率良く行うことができるようになり、情報端末としての携帯電話の用途範囲が飛躍的に拡大することは間違いありません。

アドバンスト・メディアはこのたび富士通株式会社(本社:東京都港区、代表取締役社長: 黒川博昭、以下富士通)が試作に成功したDSRのLSIを利用し、現在市販されている携帯電話に接続し使用する小型の分散型音声認識モジュールを製品化します。本モジュールを用いることで、DSR技術を利用した携帯電話上の各種アプリケーション開発が可能になります。携帯電話メーカ、キャリア、コンテンツプロバイダーに向け10月から評価・開発用途での出荷を開始します。

本モジュールは、アドバンスト・メディアが開発した AmiVoice(R) DSR 技術と、富士通の半導体技術を用いて共同で開発・製品化するものです。両社は、株式会社NTTドコモより来春発売予定のビジネスコンシューマ向けFOMA(R)端末やボーダフォン株式会社のV602SH端末などに接続し、各携帯電話メーカ、キャリア、コンテンツプロバイダーが各種アプリケーション開発について評価・開発できるようにする予定です。このビジネスコンシューマ向けFOMA(R)端末は、想定では一般インターネットサイトへのアクセスを可能とするブラウザや、公衆無線LANサービスへ対応する機能等が搭載されると聞いており、もし搭載されるならば、高精度でかつ高度な音声入力との相乗効果で広範囲のビジネスシーンで飛躍的な利便性の向上が期待できると考えられます。

【製品の概要】

● 小型分散型音声認識モジュール

<外観>

(小型分散型音声認識モジュール接続例)

<仕様>

表 小型分散型音声認識モジュール主要諸元

項目 内容

形状 筐体無、基板(バッテリー含む)

サイズ 55.0(W)X46.0(D)X20.0(H) (mm)

バッテリ含む、マイク含まず

電源供給方式 Li-Ionバッテリ搭載 (3.7V)

(ACアダプタ付 5V)

内部電源電圧 3.3V/1.8V

機能・構成 DSR処理機能LSI

音声入出力用I/F(マイク含む)

携帯電話用シリアルI/F

制御用マイコン

電源スイッチ

LED表示

◆お問合せ先:

【製品関連お問い合わせ先】

株式会社 アドバンスト・メディア

ソリューション営業部

TEL:03-5958-1091

FAX:03-5958-1033

Email

info@advanced-media.co.jp

【報道関係についてのお問い合わせ】

株式会社 アドバンスト・メディア

広報・IR室

TEL:03-5958-1091

FAX:03-5958-1033

Email

press@advanced-media.co.jp

■アドバンスト・メディアについて

アドバンスト・メディアは、独自の技術による日本語連続音声認識システム AmiVoice(R) を開発し、“声”で文章入力などができる各種ソリューションを提供してきました。AmiVoice(R) は不特定話者に対応していますので、利用者毎に声の事前学習(エンロールメント)を行うことなく、すぐに音声入力できます。DSR技術を日本で最初に製品化し、携帯電話他のモバイル環境の音声認識において業界をリードしています。

【会社概要】

社   名 : 株式会社アドバンスト・メディア

代 表 者 : 代表取締役社長 鈴木 清幸

本   社 : 東京都豊島区東池袋3-1-1 サンシャイン60 48階

U R L :

http://www.advanced-media.co.jp/


設   立 : 1997年12月

資 本 金 : 20億6,125万円

事業内容 : 音声認識・音声認証システムに関する開発業務ならびにコンサルティング日本語音声認識システム開発ツール「AmiVoice」および、音声認証「AmiVoice ID」の市場化マーケティング、システム開発、ミドルウェア製品販売およびパッケージ製品販売

先端技術を利用したシステム開発&受託業務

海外の先端技術に関わるライセンス・ビジネス

※ AmiVoice(R) 及びロゴマークは(株)アドバンスト・メディアの登録商標です。

※ 「FOMA/フォーマ」はNTTドコモの登録商標です。

国内シェアNo.1国内シェアNo.1AmiVoiceⓇAmiVoiceⓇ

*出典:合同会社ecarlate「音声認識市場動向2024」
ソフトウェア/クラウドサービス市場

AmiVoiceのAI音声認識は、
音の情報と言語の情報を密接に組合せながら、
音声を「文字」に変換する技術です。