速報:Amazon Echo国内発売。日本語用に「全く新しい言語モデル」採用 - Engadget 日本版

これまで、英語とドイツ語に対応していた音声認識AIエンジンのAlexaだが、「Amazon Echo」の日本発売に際して、日本語に対応するため1年の歳月が必要だったそうだ。

上記記事にも、その難しさのポイントの一つとして、同音異義語の多さが挙げられている。
アルファベットのような表音文字だけで構成される言語に比べ、漢字という表意文字を持つ日本語は、同じ読み仮名でも様々な言葉があり、それを耳で聴く場合、前後の文脈でどの言葉かを判断している。

それらを正しく認識するために、全く新しい言語モデルを導入せざるを得なかったという。

Googleなんかだと、日本にも以前から開発拠点があり、Googleアシスタントの日本語技術者が多数いるため、Google Homeの日本語対応もさほど難しくなかったと思われるが、Amazonは日本に研究開発拠点がなく、開発当初は日本語対応について何も考えていなかったと思われるAlexaに対して、人材を集めるところから始めなければいけなかっただろうから、日本語対応に時間がかかったのも分かる気がする。

さて、彼らの言う難しさをもう少し、詳しく説明しよう。

おそらく、Alexaの音声認識エンジンは、これまで表音文字に対応した言語モデルを採用していたのだろう。だから、日本語についても、音声を読み仮名に変換し、それを形態素解析と呼ばれる処理にかけて、品詞に分解するところまでは、従来のエンジンの延長上で達成できたと思われる。