9月7日より、スタンドアローン型文字起こしシステム「AmiVoice MinutesWriter」がバージョン6.71に更新しました。主なバージョンアップは下記の通りです。
【新機能】
1. AmiVoice Recorder
■1-1. プロジェクトの起動方法刷新
プロジェクト起動ファイルを一括して管理できるように変更しました。
起動用のプロジェクトファイル(拡張子avnrs/avsrsのファイル)を複数用意しデスクトップ等が煩雑になる事例を多く見うけました。プロジェクトファイルと音声認識ファイル「VText」の関連性をよく分かりやすくし、利便性を高める為、システム内の「プロジェクト一覧」にてプロジェクトファイルを一元管理するように改めました。
右側のボタンでプロジェクトの「新規作成」「プロジェクト名の変更」「複製」「削除」ができます。また、「プロジェクトを取り込む」ボタンより従前のプロジェクトファイルを取り込む事ができます。(本機能リリース後も既存のプロジェクトファイルは使用可能です。)
プロジェクト一覧は「設定情報を全てのアカウントで共有する」に設定✅(デフォルト)されていればRecorderパソコンにログインするアカウントで共有されます。
ログインアカウント毎にプロジェクトの登録を管理する場合はチェックを外してください。
(「設定情報を全てのアカウントで共有する」は「設定」メニューの「操作設定」で設定します。)
■1-2. VTextファイルを分割せず1ファイルで書き出せる機能を追加(64bit版のみの機能)
「録音データ作成オプション」に「音声認識終了後に自動的にVTextファイルを書き出す」という項目が追加になりました。こちらを選択した場合はVTextファイルが分割されません。ただし録音終了までに時間が掛かる場合があるので「録音データを閉じています」のメッセージが消えるまでアプリケーションを閉じないようにしてください。
2. AmiVoice Recorder/AmiVoice Recognizer共通
■2-1. Bi-LSTM音響モデルに対応
双方向型のディープラーニング技術「Bi-LSTM(Bidirectional Long Short-Term Memory)」を実装した音声認識エンジンに対応いたしました。これによりエラー改善率が向上し、認識率が向上いたします。順次Bi-LSTMを採用したエンジンをリリースいたします。
■2-2. ユーザー単語登録機能の強化
ユーザー単語管理を「共通単語グループ」と「個別単語グループ」の2種類で登録できるように改良しました。
音声認識に使用するユーザー単語を
①単語登録なし
②共通単語グループ
③共通単語グループ+個別単語グループ
の3パターンから選択して使用する事ができます。
それぞれCSVファイルへのエクスポート、インポートが行えますので、メンテナンスが容易に行えます。
【共通単語グループの登録画面】
【個別単語グループの登録画面】
Recorder録音時に使用する登録単語を選択して使用します。
3. AmiVoice Rewriter
■3-1. 話者ラベリング機能追加(VTextファイル編集時の機能)
Rewriterで話者名を追加する際に「同一話者を推定して話者名を自動入力する」機能を追加いたしました。
この機能は選択した行の「話者の声の特徴量」を教師データにして、選択行以降の話者名欄に自動的に話者名を入力する機能です。
長めの発話の方が精度は高くなります。長めの発話の部分で✅を入れてお使いください。
ただし録音状況が悪い、発話かぶりが多いなど、思うような精度が出ない場合もございます。ご了承ください。
※ControlManager接続時は機能しません。
選択行よりも下の行で話者が切り替わったと判断した時に話者名が入ります。
■3-2. 連続再生時のセグメント連動機能追加
連続再生機能で音声を確認していると、修正したいセグメントに差し掛かった時にセグメントを選択する必要がありました。
今回自動的にセグメントを追尾する機能を追加しましたので修正するエリアに差し掛かりましたら一時停止(「Ctrl」+「G」)を行い、認識結果の編集を行ってください。
この機能は「操作設定」の「その他」、「カーソル位置に連動してセグメント移動」で設定変更できます。従来どおりの挙動でご使用される場合は設定を「いいえ」に変更してください。
■3-3. 「編集内容の書出し」に機能追加
複数のVTextファイルをまとめて1ファイルのWORDに出力する場合、従来はワークスペースビューにある「編集内容の書き出し」を選択する必要があり、「編集内容の書き出し」方法が分かりにくい面がありました。
今回このインターフェースを見直し、複数のVTextを開いた状態で画面上部の「編集内容の書き出し」ボタンをクリックすると右側に出力するVTextを選択できるエリアを追加しました。日時が若い順に並んでいますので基本的にはそのまま「まとめて一つのファイルに書き出す」に✅を入れて書き出し作業を行ってください。
印刷順を変更する場合は画面右側の矢印キーで上下に移動させてから出力処理を行ってください。
【修正】
4. AmiVoice Recorder/AmiVoice Recognizer共通
■4-1. 音声認識設定を「精度優先」「速度優先」の二つから選択する形式に変更
Bi-LSTM音声認識エンジンでは「精度優先」「速度優先」からの選択となります。 「精度優先」は処理時間と認識精度のバランスが一番いいお勧めの設定となります。処理時間を速くしたい場合は「速度優先」をお使いください。
またRecorderとRecognizerでインターフェースが異なっておりましたので同一のインターフェースに統一しました。
■4-2. 「発話検出設定」を廃止
発話を検出する「セグメンタ」を最新の発話検出モジュールを使用する仕様にいたしました。設定画面が不要となりましたので廃止しました。
5. 推奨環境
■5-1. Windows7 Proについて
Microsoft社のサポートが終了したWindows7 Proを動作確認済みOSの対象外といたしました。既に多くの企業、自治体でWindows7の使用は終了していることもあり、サポートの終わったWindows7は動作確認テストから除外いたしました。
■5-2. 推奨OSについて
年次改良によりメモリー使用量が増加傾向にあるため推奨OSは64bit版WindowsOSとしました。ディープラーニング系の音声認識エンジンになるとともに、辞書の語彙数も徐々に増えていくためメモリー消費量も年々増大してきました。
今後もメモリー使用量が減ることは無いであろうという予測の元、今後新規にインストールする際は64bit版WindowsOSを推奨環境とさせていただきます。
6. その他
■6-1. HASPドライバーをSentinelRuntime Ver8.11に更新
Windows10Pro Ver2004に対応しました。
Microsoft社から提供が開始されているWindows10の「Windows 10 May 2020 Update」(バージョン2004)の問題により、編集専用ソフト「AmiVoice Rewriter」を起動する際に使用するUSBキーが使用できない事象が報告されています。
Windows10Pro Ver2004にアップデートする前にアプリケーションCD,バージョン6.71に収納しているHASPドライバーVer8.11でアップデートを行ってください。