音声によるキャプション入力で、担当デスクの作業負担を軽減
共同通信社ではスポーツイベントや事件・事故現場から説明付きで素早く写真を送信すべく、2018年のサッカーW杯ロシア大会より、撮影した写真のキャプションを音声で吹き込む運用を始めました。音声データは写真受信システムに送られ、担当デスクが再生し写真説明(キャプション)を編集しています。
W杯や大きな国際競技では、1試合で500枚以上の写真を出稿、リアルタイムで加盟新聞社に配信しており、集中力とスピード感が求められる文字入力は肉体的な負荷が大きく、課題となっていました。また担当デスクはテレビで実況を聞きながら作業することが多く、音声をテキストに変換して欲しい、という要望が多く挙がっていました。
これらの背景をもとに、共同通信社のシステム担当者がテキスト変換ツールを精査した結果、音声認識ソフト「AmiVoice Ex7 Business」を導入することとなりました。2019年ラグビーW杯日本大会から運用がスタートしています。
固有名詞・専門用語も即座に認識、業務効率化を実現
音声認識技術によってカメラマンの声を自動で文字化し、その変換結果を元に写真内容の確認、選別、選手の特定、説明文の編集といった作業を効率的、かつスピーディに行うことができるようになりました。
「AmiVoice Ex7 Business」では固有名詞や専門用語等の単語カスタマイズも可能です。ラグビーW杯では、選手名やラグビー用語等をあらかじめ学習させた音声認識エンジンを使用することで、例えば「ヴァルアサエリ愛」「アマナキ・レレイ・マフィ」といった変換が難しい日本代表選手名も正確に変換できました。
音声認識の更なる活用を検討
2020年の東京オリンピック・パラリンピックに向け、国内外で開催される競技大会は今後も増加が見込まれます。共同通信社では音声認識技術の更なる活用拡大を検討しています。
パートナー企業
株式会社Too様
https://www.too.com/