Microsoft Speech SDK で音声認識

Microsoft Speech SDKによる日本語音声認識の設定 の編集

最終更新: 2015-04-02 (木) 01:03:10 (1357d)

想定する環境

このページでは、以下の二つが適切にインストールされた状態での基本的な設定に関して説明する。

  • Speech SDK 5.1
  • 5.1 Language Pack

インストールが済んでいない場合は、 Speech SDK 5.1 以上の2つを以下のリンクでダウンロードし、インストールを済ませること。

音声認識の設定

Speech SDK の設定は、 すべて「コントロールパネル」の「音声認識(XPの場合)/スピーチ(2000の場合)」で行う。 設定の最初の画面を以下に示す。

sr_setting.png

言語が「Microsoft Japanese Recognizer v5.1」 になっていることを確認しよう *1 。 この設定ツールを使ってできる主なことは、マイクの音量自動調節と音声認識の個別化である。 この二つの設定を適切に行うことで認識率の向上が見込まれる。 特に重要なのが、音声認識の個別化で、 トレーニングを重ねることで自分の音声の特徴をシステムが学習し、 認識率が向上する。

マイクの音量自動調節を行うには、「マイクの構成」ボタンを押す。 音声認識の個別化を行うには、「プロファイルのトレーニング」ボタンを押す。 後は画面の指示に従って対話的に処理を行っていくことで設定が完了する。 音声認識の個別化は、大変重要であると個人的には感じている。 最低でも、3つのセッションを読んで個別化を行っておくと安定して認識されるようになる。

コメント

コメントはありません。 コメント/mssdk/setting

お名前: