■IBMサミット2016・相関関係Vs. 因果関係 2016.06.25
イギリスの寓話・・・
七面鳥が、毎日、エサを与えられていた。
雨の日も晴れの日も雪の日も、毎朝9時キッカリに。それが、毎日続いたので、七面鳥は、その事実(データ)から、ある法則を発見した。
「毎朝9時に必ずエサを与えられる」
ところが、ある日、七面鳥の期待は裏切られた。首を切り落とされたのである。というのも、その日はクリスマス・イヴだった・・・
この寓話は示唆に富んでいる。
七面鳥がエサをもらえたのは、クリスマスの夜、食卓を飾るため。ところが、七面鳥は、その因果関係に気づかず、相関関係をうのみにした・・・毎朝エサをもらえるから明日ももらえると。
このように、過去のデータから相関関係を見つけ出し、普遍的ルールに置き換えることを「帰納法」とよんでいる。ところが、それを信じた七面鳥の末路は哀れなものだった。つまり、この寓話は人類最強の推論「帰納法」に警告を発しているのだ。
それがどーした?
などと、余裕をかましている場合ではない。じつは大問題なのだ。
というのも・・・
今、飛ぶ鳥を落とす勢いの人工知能(AI)の機械学習はすべてコレ。その人工知能が、人間の代わりに仕事をするというのだから、物騒な話だ。人類が哀れな七面鳥の二の舞にならないよう心から願っている。
そうは言うけど・・・
ロボット(人工知能)が働いて、人間が遊んで暮らす?けっこうな話じゃないか。
ノーノー、人生そんなに甘くない。
その先に待っているのは、富者と貧者が永遠に逆転できない究極のカースト社会・・・ユートピアどころかディストピアなのだ。
もちろん、人間の代わりができるロボットとなると、ペッパーやアシモというわけにはいかない。
というのも・・・
シナリオがないとしゃべれないとか、ただの人工無脳じゃんとか、階段を上れるからどーした、などと陰口を叩かれているから。
ということで、人間に取って代わるのは、人間を超える身体と知能をもつ「対話型ロボット」(あたりまえ)。
では、いつ実現する?
10年後はムリ、20年後はビミョー、50年後なら大丈夫かも・・・
かなり気の長い話だ。
では、ロボットの何が難しいのか?
すべて!
ロボットの教則本によれば、ロボットの構成要素は3つある。
1.頭脳(思考)
2.センサー(探知)
3.アクチュエータ(運動)
この中で、対話型ロボットに近いのは「2.センサー(探知)」ぐらい。「3.アクチュエータ(運動)」は小型化と軽量化に問題があり、「1.頭脳(思考)」にいたってはメドも立っていない。
というわけで、3つの要素はクリアできていない。ところが、その3要素以外にも重要なものがある。
頭脳、センサー、アクチュエータを動かすソフトウェアだ。PCやスマホでいうところのアプリ、それを作るためのツールである。
コンピュータ、ソフトがなければ、タダの箱・・・その昔、ソフト屋が好んで使った決め台詞だが、これをロボットにあてはめると、
ロボット、ソフトがなければ、でくの坊・・・
というわけで、コンピュータ同様、ロボットもアプリが重要だ。もちろん、アプリを作るためのソフトウェア開発環境も欠かせない。
ここで、ソフトウェア開発環境とはソフトウェアを開発するための道具一式。具体的には、ソフトウェア部品を集めたライブラリ、プログラムを作成するツールで構成される。3Dコンテンツのデファクトスタンダード「Unity」もその一つだ。このような基盤を「ソフトウェア開発プラットフォーム」とよんでいる。
そして、ロボットのソフトウェア開発プラットフォームで、先手を打ったのがIBMだ。
2016年5月、「IBM Watson Summit 2016」で、IBMはバズーカをぶちかました。あらゆるロボットに使えるソフトウェア開発プラットフォーム「ロボット共通基盤」を発表したのだ(初めてではないが)。
とはいえ、ロボットの開発プラットフォームはこれだけではない。たとえば、ソフトバンク・ペッパーの「Choregraphe(コレグラフ)」。ソフトバンクロボティクスが提供する無料ツールだが、完成度は高い。ビジュアル化されたわかりやすいインターフェイス、豊富な機能、動きをフローで記述するプログラムレスな環境。
ただし・・・
「対話」に大きな制限がある。あらかじめプログラムした対話しかできないのだ。もっとも、これはペッパーの問題ではない。人工知能の自然言語処理技術の限界なのだ。
IBMの「ロボット共通基盤」に話をもどそう。
特徴は5つある。
1.ロボットの種類に依存しない(ポータビリティ)。つまり、どんなロボットのアプリ開発にも使える。
2.英語、ドイツ語、フランス語、スペイン語、イタリア語、日本語に対応(マルチリンガル)。
3.複数のロボットと連携できる(集団行動)。
4.1台のロボットで複数の人間の相手ができる(1台2役~)。
5.Watsonと連携できる(現在最強の質問応答システム)。
この5つの機能を実現するために、7つのコンポーネントが用意されている。
1.NLC:自然言語を理解し答を返す。おもに、短文テキストの分類を行う。最強の「DeepLearning」でウィキペディア(Wikipedia)を機械学習している。
2.DLG:ルールベースで自然言語の対話を組み込む。対話アプリの主業務。スクリプトベースで、機械学習はナシ(もしルールベースで機械学習なら夢の世間話が可能に!)
3.R&R:情報検索とランク付けをする。機械学習付き(検索エンジンみたいなもの)。
4.TTS:テキストを音声に変換する(音声合成)
5.STT:音声をテキストに変換する(音声認識)。DeepLearningで機械学習している。
6.画像認識(最近追加された)。
7.Watson(APIをcallして使う)。
さすがはIBM。思いつくものはすべて網羅している。これで、ロボットがカンタンに作れるぞ!
と思ったら大間違い。ペッパー同様、「対話」が苦手なのだ。
というのも・・・
対話は、「DLG」で実装するが、「きっかけ」とそれに対応する「アクション」をすべて記述する必要がある。
たとえば・・・
もし、「おはよう」と言われたら(きっかけ)、「オハヨウ」と答える(アクション)。
もちろん、これだけなら、「おはよう」にしか答えられない。そこで、想定される「きかっけ-アクション」をすべて記述する・・・
「馬鹿」-「ソッチコソ、バカ」
「人生楽しいですか」-「ンナワケナイ」
「ボクはリンゴが好きなんだ」-「ワタシ、タベレナイケド、キミガリンゴスキナコト、オボエテオクヨ」(これはイイ)。
・・・・
このように、想定される問答をすべて手作業で組み込む方法を「ルールベース」とよんでいる(やっとれん)。
一方、機械式に組み込む方法もある。
膨大な対話データを学習させ、こう言われたら、こう言い返す確率が一番高い、を基準に答えを返す。つまり、七面鳥のように相関関係で学習し、統計学的に答えを出すわけだ。
ただし、言葉と文の意味を理解していないので、とんでもない答えを返すこともある。だから、ウィットがモノを言う世間話や雑談はムリ。一方、コールセンターなど答えが決まっている質問応答なら大丈夫(実績アリ)。
前述したように、問答は「きっかけーアクション」で記述されるが、この対を「ルールセット」とよんでいる。構造はシンプルだが、数がハンパないので、これで、人間なみの対話を実現するのはムリ。
じつは、第二次人工知能ブームが失敗したのは、この「ルールベース」を過信したから。
そこで、Watsonを使って対話させようとする試みもある。
ただし、Watsonは、「答えがある質問」に限られるので、フリートークには向かない。対話というより「質問応答システム」なのだ。そこで、画像認識や音声認識で成果をあげている機械学習「DeepLearning」を利用しようとする向きもあるが、メドが立っていない。
私見だが・・・
画像認識や音声認識は、最小単位の画素や音素そのものに意味がない。集合として初めて意味をもつ。つまり、本質は「認識=パターンマッチング」なのだ。
「DeepLearning」はパターンマッチングに向いているので、画像認識と音声認識で成果が上がっただけではないか。
ところが、自然言語処理は、最小単位の単語が大きな意味を持つ。だから、「単語の並び=パターンマッチング」で処理できるとは思えない。つまり、今の「DeepLearning」ではムリ?
IBMのロボット・プラットフォームに話をもどそう。
まずは気になるお値段・・・ロボット共通基盤は無償(Unityも無償)。
ただし、Watsonを使う場合は、50万円/月。これは、IBMのクラウドサービス「Bluemix」を介して、WatsonのAPIをcallして使う(サーバーはダラスにある)。ただし、APIのcallは30万回まで(ケチ)。最初の1ヶ月はトライアル期間で無償というが、1ヶ月で何ができるのでしょう?
悪口はこのくらいにして(株主なので)、IBMのWatson戦略に移ろう。
コンソーシアムを立ち上げて、ユースケースの開発を促進し、日本標準を確立する。さらに、日本発の世界のデファクトスタンダードを目指すという。
遠大な戦略にみえるが、すでに実績もある。ハウステンボスの「変なホテル」の接客ロボットだ。IBMの「ロボット共通基盤」で開発されているという。
ちなみに、この接客ロボットの導入により、人間のスタッフが半分になったという。冒頭の「ロボットが働いて、人間が遊んで暮らす」がすでに始まっているわけだ。ハウステンボスの澤田社長によれば、今後、少子高齢化が進むのでロボット化は必須だという。
理にかなっているけど、人間の仕事が半分になる・・・
さらに、Watsonは在宅高齢者向けサービスにも期待されている。
高齢者と話をしたり、ニュースを読み上げたり、部屋の温度や照明を調整したり、TVのチャンネルを変えたり。病院と連携し、薬の服用まで指示してくれる。高齢者の見守り役、コンシェルジュというところだろう。
というわけで、ロボットが進化するほど、人間に近づいていく。ただし、人間に近ければ良いというわけではない。
不気味の谷・・・ロボットが人間に近づくほど、人間の感情はプラスになる。ところが、途中で、中途半端に人間らしくなると、人間の感情はマイナスに落ち込む(気持ち悪い)。これが「不気味の谷」だ。それを乗り越えて、人間にさらに近づくと、人間の感情は再びプラスに転ずる。
ヒト型ロボットも一筋縄ではいかないのですね。
ところで・・・
IBMの「ロボット共通基盤+Watson」は成功するのだろうか?
IBMは3つの用途を想定している。
1.エンゲージメント(顧客対応)
2.ディスカバリー(知識からの発見)
3.デシジョン(専門家の判断支援)
そのための技術、サポート、販促にスキはない。しかも、実績もともなっている。
成功間違いなし!?
そうでもない。じつは、大きな懸念点があるのだ。
ロボット共通基盤もWatsonも大掛かりすぎる!
Watsonの使用料高価すぎ!
さらに・・・
技術的な問題もある。
「ロボット共通基盤+Watson」の機械学習は、因果関係ではなく相関関係から学ぶ。早い話、膨大なビッグデータから相関関係を見つけ、ルールに置き換えているだけ。
つまり、七面鳥・・・
このままでは、「ロボット共通基盤+Watson」は、スリムで軽く安価なプラットフォームにひっくり返される。かつて、大型コンピュータが、パソコンに取って代わられたように。
今ごろ、世界のどこかで・・・第二のアップル(Apple)がロボット革命を狙っているのかもしれない。
by R.B