人工知能としてのAlexaの限界

2017年11月23日 - AV機器

Alexaが、「AI技術を使用した音声操作を実現している」というような言い方をするが、AlexaのスキルのSDKを少し読むと、モダンなAI技術であるディーブラーニングが適用される部分というのが、実際にはかなり限られていることが分かってくる。

まず、音声操作を実現するステップを分解して説明すると、

STEP1：音声をかなの文章に認識して変換（Alexaの音声認識API）…これについては、ディープラーニングの技術を使用して、利用者の声の認識率が次第に高まるような学習を行っている

STEP2：音声を認識したかなの文章を形態素（品詞）に分解（Alexaの形態素解析API）…Alexaが行ってくれるが、ディープラーニングの技術は使われていないと思われ、学習は限定的

STEP3：形態素に分解した文章に基づき、主語述語目的語などの受け掛りを判定し、その命令内容に基づき処理を行う（スキル）

のように分かれる。

すなわち、実際に音声でしゃべった言葉の「意味」を解釈して処理を決める部分は、Alexaの役割ではなく、スキルというアプリケーションプログラムで実現される。

スキルは、手続き型言語で書かれているため、例えばどんな言い方のコマンドを受け付けるかは、スキルでプログラミングされていなければ解釈できず、利用者の言い方を自動的に学習して、理解できる言い方が自動的に広がっていくようなことは起きえない。

もし、スキルが解釈できる言い方の自由度が、ある日もし広がったとしたら、スキルのプログラムが人によって改良されて、より多様な言い方に対応しただけに過ぎない。

現実のスキルを見ても、会話は基本、一往復で完了しており、前の会話内容を受けて、次の会話が続くようなタイプのスキルは、それを全て手続き型のプログラミングで実現する必要があり、特定のパターンしか実現は難しいはずだ。

難しいから、会話するアプリは、ピカチュウだったり、初音ミクと会話する「人口無脳」的なスキルにならざるを得ないのだろう。

こうして技術的な観点から見てゆくと、Amazon Echoと何気ない会話をしていたら、だんだんそれを学習して、賢い会話ができるようになる、というようなことは、Alexaに関しては起こりえないと言っていい。

Alexaが、ディープラーニングによって自動的に学習できるのは、あくまで様々な音声の認識精度を上げる部分に関してのみなのであり、それ以外に期待してはいけない。
これが、Alexaの人工知能の限界であり、割り切りのポイントなのだと思う。

Amazonが優秀で人気のあるスキルの開発に対し、報酬を与える制度を設けているが、そうした優れたスキルを作るには、人ががんばって凝ったプログラミングするしかないからこそ、そうした制度が必要になっているとも言える。

Google Developers Japan: Google アシスタント対応アプリを日本語で開発してみよう

ところで、Google Homeに関しても、ディープラーニングの適用範囲が同じなのかどうかは、まだ詳しく調べていないので分からないが、多分似たようなものだろう。
ただ、音声認識のディーラーニングは、スマホなどのGoogle Nowでの蓄積が既にあって精度が向上しているだろうし、また、Alexaのスキルに相当するアプリから、Googleの様々な便利なクラウドAPIが利用できることが想定される。

そして、そのAPIの先にあるクラウド側では、ディープラーニングの技術を活用した様々な最適化が行われていくため、その回答内容も、結果として進化し続ける可能性がある。

従って、GoogleアシスタントがAlexaより、AI的な意味で賢い反応ができるということは、間違いなくありそうだ。

他方、Alexaには、Google Homeのように自由に使える賢いクラウドAPIが少ない。
Alexaに何かについて質問をしても、その回答は基本Wikipediaの検索結果であり、そもそもWebの検索エンジンも、地図のロケーションにマッピングされたお店や施設情報も、経路検索の機能も、Amazon自身は持っていないから、他社のAPIを使うしかないだろうが、タダで気前よく使わしてくれる事業者はあまりいないだろう。
このため、Alexaが、何かについて尋ねてもマトモに答えてくれないのは、なかなか解決できない根本的な問題だろうな。

ただ、Amazonとマイクロソフトの提携が発表されたことにより、今後、Alexaのスキルで、検索エンジンとしてBingが自由に使えるようになるかもしれないし、お店情報や経路検索などは、様々な会社が得意分野のスキルを開発することで、改善される部分もあるだろう。

様々な機能、サービスで遅れている日本語対応の推進と併せて、是非とも早急にAmazonに改善して欲しいところだ。

関連記事：
「Amazon Echo」の日本語版に迫る：トドのつまりは・・・　V2：So-netブログ
「ChatGPT」に対する私のスタンス：トドのつまりは・・・　V2：So-netブログ

人気ブログランキングへ

人工知能としてのAlexaの限界

関連する記事