テクノロジー アトムを使った開発
Join our mailing list

Natural Speech Interface Development

自然音声言語インターフェース開発

私たちが毎日の会話で使っている通常のはなしことばは、自然音声言語と呼ばれています。 自然音声言語に対応する音声インターフェースを開発するには、 システムが自然音声言語を理解できるようにすることと、 システムが自然音声言語で話すことができるようにすることの 両方が必要です。 それぞれのためのプログラムは 文法、 および ダイアログと呼ばれています。

アトム音声対話SDKには、
1)パーサー:ユーザ発話の意味を抽出する機構
2)ダイアログマネジャー:システムの挙動を決定する機構
3)自然言語ジェネレータ:システム発話内容を自然言語に変換する機構
のみっつの機構が含まれており、 このみっつの機構が文法プログラムとダイアログプログラムと連携して、 ユーザの言うことを理解し、その理解に基づいて期待される挙動をする 賢い自然音声言語での対話システムを構築します。

  1. アプリケーションによって予想されるユーザ発話をデータとして録音収集
  2. 音声認識エンジンがユーザの発話をテキストに変換
  3. データをもとに文法を開発
  4. 開発した文法をもとに、アトムのパーサーがテキストからユーザ発話の意味を抽出
  5. ユーザ発話の意味(およびその直前のインタラクション内容) によってシステムがどう挙動するかを決定するダイアログファイルを開発
  6. 開発したダイアログをもとに、ダイアログマネジャーがユーザに返答したり、 必要な場合には更にユーザから情報を引き出すよう 質問をしたり、なんらかのアクションを起こすことを決定
  7. (6)の決定に基づき、アトムの自然言語ジェネレータが ユーザへの質問を自然言語テキストに変換
  8. (7)の結果を、音声合成エンジンが音声に変換し、ユーザに出力
    (注:太字は開発作業、細字はアトムランタイムエンジンの挙動を表します。)

文法:システムに自然言語を理解させる

文法とは、ユーザの話す自然音声言語をシステムが理解できるようにするプログラムです。 文法プログラムは、ユーザが話すであろうフレーズや単語を網羅するよう作成されます。

たとえば探し物についてたずねるとき、 「XXはどこですか」、「XXはどこにありますか」、「XXってどこにあるの」など、 ユーザによって、また状況によって違う話し方が予想されます。 そのため、自然で豊かな音声言語インターフェースを開発するには、 できるだけ豊富な文法プログラムを作成する必要があります。
文法開発について

ダイアログ:システムに自然言語で話をさせる

ユーザの言ったことを理解したのち、 システムはそれに応じて何をするべきか (音声で回答するか、音声で質問するか、なんらかのアクションを起こすか、など) を決定しなければなりません。 「ユーザがこんな意味のことを話したときには、これをせよ」と 規定するプログラムがダイアログです。
ダイアログ開発について

*アジリングアでは音声対話システムの開発に当たり コンサルタントサービス を承っております。 こちらまで お気軽にご相談ください。