ディープラーニング技術を実装したオフラインで動作するローカル型音声認識エンジン
株式会社アドバンスト・メディア(本社:東京都豊島区、代表取締役会長兼社長:鈴木清幸 以下、アドバンスト・メディア)の日本語・英語の音声認識エンジンAmiVoiceが、au 2017年夏モデルスマートフォンで京セラ株式会社(以下京セラ)製の「TORQUE® G03」に採用されました。ディープラーニング技術※を実装したオフラインで動作するローカル型音声認識エンジンです
「TORQUE® G03」は、米国国防総省が定める耐久試験(MIL-STD-810G)19項目に、京セラ独自の耐久試験2項目(耐海水・耐荷重)を加えた計21項目に準拠した高耐久性能を特長とするスマートフォンです。約1,300万画素のメインカメラに加えて、臨場感あふれる映像の撮影を可能にした135°スーパーワイドアクションカメラが搭載されています。この度、カメラの基本操作を音声で行える「ボイスコントロール」機能として、日本語と英語の音声認識技術AmiVoiceが採用されました。
当機能は、音声認識を使うことで声によりカメラ操作を行うものです。腕を高く伸ばしての撮影時やセルフィー撮影時など手が届きにくい場面や手ブレ防止など、スマホでのカメラ操作の不便を解消いたします。「シャッター(Shutter)」や「チーズ(Cheese)」と発話することでシャッターを切ることができる他、「ズームイン(Zoom in)」「ズームアウト(Zoom out)」操作、カメラのモード切替えなどが行えます。また静止画に加えて、動画撮影の録画スタートも音声でコントロールすることができます。
オフラインで動作するローカル版音声認識エンジンで、ディープラーニング技術を実装しています。これにより、騒音下やマイクと口元の距離が離れていても、高い認識率を誇ります。従来の音声認識エンジンと比較し、誤認識が約25%(自社調べ)改善いたしました。また、独自の「発話区間検出技術」により、ノイズ成分の効果的な排除、発話音声コマンドへの応答速度向上、ユーザーフレンドリーな操作性を実現いたしました。
「TORQUE® G03」の詳細は下記のWebサイトをご覧ください。
https://www.au.com/mobile/product/smartphone/g03/
http://www.kyocera.co.jp/prdct/telecom/consumer/g03/
アドバンスト・メディアは、今後もスマートフォンをはじめとする各種デバイスへの音声認識技術の提供を積極的に推進いたします。
※注釈 : ディープラーニングとは、機械が人間の脳の構造をソフトウェア的に模倣し、データの特徴を学習して認識や分類を行う「機械学習」の手法。
※「TORQUE」は京セラ株式会社の登録商標です。
以上
本件のお問い合わせ
経営管理本部 広報チーム
TEL:03-5958-1307
FAX:03-5958-1032
クラウド事業部
TEL:03-5958-1522
FAX:03-5958-1033