SSブログ

「Amazon Echo」の日本語版に迫る [AV機器]

スポンサードリンク



alexa_icon.png

速報:Amazon Echo国内発売。日本語用に「全く新しい言語モデル」採用 - Engadget 日本版

これまで、英語とドイツ語に対応していた音声認識AIエンジンのAlexaだが、「Amazon Echo」の日本発売に際して、日本語に対応するため1年の歳月が必要だったそうだ。

上記記事にも、その難しさのポイントの一つとして、同音異義語の多さが挙げられている。
アルファベットのような表音文字だけで構成される言語に比べ、漢字という表意文字を持つ日本語は、同じ読み仮名でも様々な言葉があり、それを耳で聴く場合、前後の文脈でどの言葉かを判断している。

それらを正しく認識するために、全く新しい言語モデルを導入せざるを得なかったという。

Googleなんかだと、日本にも以前から開発拠点があり、Googleアシスタントの日本語技術者が多数いるため、Google Homeの日本語対応もさほど難しくなかったと思われるが、Amazonは日本に研究開発拠点がなく、開発当初は日本語対応について何も考えていなかったと思われるAlexaに対して、人材を集めるところから始めなければいけなかっただろうから、日本語対応に時間がかかったのも分かる気がする。

さて、彼らの言う難しさをもう少し、詳しく説明しよう。

おそらく、Alexaの音声認識エンジンは、これまで表音文字に対応した言語モデルを採用していたのだろう。だから、日本語についても、音声を読み仮名に変換し、それを形態素解析と呼ばれる処理にかけて、品詞に分解するところまでは、従来のエンジンの延長上で達成できたと思われる。

次に、日本語の読み仮名から、同音異義語を正しく判定しながら、意味を解析する部分が、英語などにない言語モデルが必要だったという部分だが、実は、この部分の技術は決して新しいものではなく、枯れた技術だ。

ATOKなどのかな漢字変換では、まさにこれをやっていて、主語や目的語につく動詞との組み合わせの相関度を考慮し、もっとも確からしい同音異義語を選択して、漢字に変換するために、(古典的な)AI辞書を持っている。
例えば、「あめがるふ」の「あめ」は、降るという動詞と結びつきが強い「雨」を選ぶべきだし、「あまいあめ」の「あめ」は、甘いという形容詞と結びつく「飴」を選ぶべきであることを、AI辞書をベースに判断するのだ。

おそらく、Amazonも、こうしたかな漢字変換の技術に精通しているエンジニアをハントして、Alexaの日本語対応を実現したものと思われる。

果たして、Alexaが、この(古典的な)AI辞書に対しても、ディープラーニングのスキームを新たに導入して、さらに進化いるのかどうかは定かではないが、Googleに比べて「あまり賢くない」と言われるAlexaが、日本語に対してはどの程度賢いのかは、楽しみだな。

「Amazon Echo」の開発環境が日本語版「Alexa」に対応。スキルの開発が可能に | ロボスタ

さて、「Amazon Echo」には、スキルと呼ばれる音声アプリを、誰でも開発することができるスキル開発支援ツール「Alexa Skills Kit (ASK)」、Alexa搭載スマートデバイス開発リソース「Alexa Voice Service (AVS)」が提供されているが、その日本語対応も発表された。

Alexaのスキルでは、基本的に無料のものしか作れず、有料販売やアプリ内課金はできないらしいのだが、その代わりに、Amazonが特定のカテゴリのスキルに対して、人気の高いスキルを開発した人に現金で報酬を支払うプログラムを実施しているらしい(日本での実施は不明)。
それが、他社を圧倒する2万ものスキルという数に現れていいるのだろう。

アマゾン、日本語版「Alexa」スキルの一覧を大公開! いきなり「250種以上」のスキルが登場 | ロボスタ

実際、発売と同時に発表された日本語版のスキルは、すでに250種類を超えるというからすごい。
一覧表では名称しか記載されていないので、具体的な機能詳細は分からないのだが、いくつか気になるスキルを見ていくと、

・radiko.jp:一番使いそうなので、対応してくれていてうれしい。できれば、最初からエリアフリーには対応してほしいところだが。
・AbemaTV:これは、FireTV端末と連携して、テレビで選局までできるのだろうか? だったら凄いが。
・Watch Videoニュース:これもFireTV端末と連携して、テレビ動画再生までできるのだろうか?
・iRobot Home:ロボット掃除機iRobotも早速日本語対応するようだ
・ラジオクラウド:アプリが探しにくいだけに、音声で検索して聴けるならこれは嬉しい。
・ピカチュウトーク:なんだこれ? ピカチュウと会話?できるのか??

音声ニュース関係が充実しているのは予想していたが、思ったよりバラエティに富んでいるな、という印象だ。

一方、正直、ぐるなびスキルでお店を教えてもらえても、音声で言われてメモするのは大変だから、スマホの方が便利だと思うし、経路検索のスキルなんかも、同様に結果のメモが大変だし、同音の違う駅も多いし、それをどう選ぶのかを考えても、音声だから便利だとは思わない。

銀行や電力会社のスキルもあるが、もし、貯金の残高参照などもできてしまうのだとしたら、セキュリティはどうなっているのか不安に感じてしまうな。

ただ、このスキルの一覧を眺めているだけで、買う前からワクワクしているのは確か。

手に入ったら、色々試してみたいと思う。

関連記事:
アマゾンがスマートスピーカー「Amazon Echo」を国内発売:トドのつまりは・・・ V2:So-netブログ



ブログランキング・にほんブログ村へ
人気ブログランキングへ




スポンサードリンク




nice!(0)  コメント(0) 
共通テーマ:日記・雑感

nice! 0

コメント 0

コメントを書く

お名前:[必須]
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

※ブログオーナーが承認したコメントのみ表示されます。

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。