ペッパーのアプリ開発記(1)~感情認識ロボット~
■ペッパーを納入する
先日、ソフトバンクの人型ロボット「ペッパー」を納入した。
納入先は介護サービスを行っている会社。ペッパーが施設の高齢者たちと話をしたり、遊んだり・・・そんなアプリを作ったのだが、プログラマーは苦労続きだった。
たとえば・・・
ペッパーを長時間踊らせると、モーターが発熱し、自動停止する。何かを処理している最中は、聞く耳を持たない(音声認識できない)。手は動くが、握力ゼロで、紙一枚持ち上げるのが精一杯。
しかも・・・
プログラムを書かなくてもアプリが作れる、はいいのだが、そのぶん、自由度が低く、できることが限られる。これでは、ペッパーはすぐにあきられる。そんなくらいなら、プログラムをゴリゴリ書いて、できることを増やした方がいい・・・などと、いろいろ思うところがあった。
まぁ、しかし、ソフトバンクに不満があるわけではない。この時期に、このような人型ロボットを世に送りだせる会社はそうない。先見性と明確なビジョンがあることは確かだ。近い将来、ロボットは一家に一台どころか、一人一台になるのだから。
その昔、パソコンゲームが一世を風靡したころ、社内ベンチャーで開発した歴史シミュレーション「GE・TEN~戦国信長伝~」がブレイクした。ログイン誌の総合ランキングで3位に入り、販売本数も1万4000本と大ヒット(当時は、1万本売れればヒットだった)。
じつは、そのうちの7割を販売してくれたがソフトバンクだった。あの頃のソフトバンクは、パソコンのパッケージソフトの卸(おろし)を生業にしていて、年商は300億円ぐらいだったと思う。それが、いまではDocomoとならぶ通信キャリア!
ところが、ここで、人型ロボット・ペッパー・・・巨大企業になっても、ベンチャースピリットを忘れないソフトバンクには脱帽だ。
ところで、顧客の満足度は?
先の納入先で、最近、お披露目会が催された。中央にいるのが、主役のペッパー君。
まずは、介護施設のスタッフの評価だが、「感動もん」だった。ペッパーがここまでできると思っていなかったのだ。
余談だが・・・
女性スタッフの背が高過ぎ!
対応してくれた女性スタッフは、二人とも身長が175センチ前後。そして、一人は腰にコルセットを巻いていた。やはり、介護現場は「膂力(りょりょく)」が欠かせないのだ。
で、肝心の高齢者の反応は?
ビミョー。
じつは、介護施設にいる高齢者は、頭も身体もしっかりした人もいれば、車椅子の人、認知症がすすんでいる人、と様々。だから、みんなに大ウケというわけにはいかない。
そこで、ペッパーに、歌って踊らせたのだが、これがなかなか好評だった。ペッパーに標準装備された踊りではなく、オリジナルの踊りを作り込んだから。歌と踊りは世代を越えて・・・はちょっとおおげさかな。
ところが、問題もあった。
■しゃべれないペッパー
「お披露目会」もたけなわ、最前列にいたおばあちゃんが、ペッパーにさかんに話しかける。
「ペッパー君、こんにちは!」
「どこから来たの?」
「いっしょに遊んで!」
「お披露目会」にピッタシカンカン、出来過ぎのセリフだが、断じてサクラではない。もちろん、事前打ち合わせもしていない。
ところが・・・
問いかけは素晴らしいのに、肝心のペッパーが反応できない。TVや雑誌で紹介されるペッパーを知っている人は、こんな答えを期待するだろう。
「こんにちは、おばあちゃん!」(ペッパーは顔認識ができる)
「ボクは、ロボット工場から来たんだよ!」
「オッケー、いっしょに遊ぼう!ボクは歌って踊れるし、ゲームもできるんだ。何して遊ぶ?」
ところが、現在のペッパーは、こんなカンタンな会話もできない。すべての質問を想定して、あらかじめ組み込んでおけば可能だが、現実的にはムリ。
じゃあ、人工知能を使ったら?
残念ながら、ペッパーには人工知能は搭載されていない。そもそも、世間話ができる人工知能なんて存在しないのだが。
ところが、それ以前に、ペッパーには重大な問題がある。
ペッパーの頭部を凝視していると、時々、耳が青く光る。それを見はからって、ペッパーに話しかけるべし!
じつは、そのときしか、ペッパーは話を聞いてくれないのだ。
ペッパーは何か処理を始めると、それで頭がいっぱいになり、聞く耳を持たない。つまり、ペッパーは会話と他の処理を同時にできないのだ。
これでは、世間話はムリ。
世間話のキモは、テンポの良さと軽快さにあるのだから。それが、耳が青く光っているときだけ話しかけてね~・・・ではねぇ。
さらに、仮に音声を取り込めたとしても、今のペッパーは、言葉の意味も文脈も理解できない。当然、答えを返すこともできない。
でも、TVで、ペッパーはペラペラしゃべっているけど?
質問と答えをあらかじめ仕込んであるだけ。考えてしゃべっているわけではない。早い話、会話のデータベースなのだ。だから、ペッパーを購入したら、すぐに音声会話でができると思ったら、大間違い。
ただし、ペッパーには液晶タッチパネルがついている。
じゃあ、それを使ったら?
えー!?人型ロボットを謳っておきながら、入力はパネルタッチで、出力は液晶表示でお願いしま~す・・・はないでしょ。
このままでは、ペッパーは1~2年であきられる、そう確信した。
そこで、ペッパーの改良案をいろいろ考えてみた。今回の開発を思い起こしながら。
■二つのペッパー
まず、ペッパーには2つのタイプがある。一般向けと法人向けだ。
最初にお値段。
一般向けは、本体価格19万8000円+月々の保守料2万5000円×12ヶ月×3年
3年しばりで「100万円」ナリ。
一方、法人向けは、本体価格0円+月々の保守料5万5000円×12ヶ月×3年
3年しばりで「200万円」ナリ。
つぎに、メンテナンス。
一般向けは、壊れたら修理費は別途必要だが、法人向けは不要(ただし、自然故障に限る。叩いたり蹴ったりして壊れましたぁ~はダメ)。
最後に、機能。
一般向けは、クラウドAIがサポートされ、カンタンな会話機能がついている。ただし、ここでいうAIは本格的な「人工知能」ではない。
一方、法人向けは、クラウドAIもカンタン会話機能もナシ。かわりに、セリフを入力するだけで会話や動作が成立するテンプレートがついている。つまり、法人向けは、用途にあわせて一から作り込んでください、というわけだ(プログラムではなくテンプレートで)。
早い話・・・
ペッパーは買っても、すぐに使えない。アプリやデータを組み込む必要があるのだ。
あたりまえ?
ところが、現実は・・・
TVや展示会でペッパーを見ると、話したり、愛嬌をふりまいたり、表情を読んだり・・・こりゃあ、使える!
そこで、ペッパーを購入するのだが・・・そのままでは何もできない。何をするにも、アプリやデータが必要なのだ。
もっとも、そんな勘違い、ミスマッチがあるから、アプリ開発の仕事が舞い込むのだが・・・メデタシ、メデタシ。
しかし、今のペッパーをみていると、先行きが不安になる。
2015年12月現在のペッパーは「でくのぼう」と言っていいだろう。一応、自走可能で、頭も手も腰も動くが、力仕事ができるわけではない。
それなら、アタマで勝負!
ところが、まともな会話もできない。
じゃあ、一体、何ができるのだ?
とツッコミが入るシチュエーションだが、それは、ソフトバンクは百も承知。会話機能を劇的に向上させようとしているのだ。具体的には・・・ペッパーにIBMのワトソンをつなぐ!
■ペッパー&ワトソン
IBMの「ワトソン」は、米国クイズ番組「ジェパディ!」で人間のチャンピオンをやぶった質問応答システムだ。構造化されたデータはもちろん、非構造化データ(生のテキスト)からも学習する。さらに、高度な推論機能を備え、正解を知らなくても、推論で答えることができる。
現在、ワトソンは、医療、医薬品開発、法務、会計・税理、コールセンター、銀行業務、とあらゆる分野に進出しつつある。ただし、厳密にはワトソンは人工知能とはいえない。事実、IBMはワトソンを「コグニティブ・コンピュータ」とよんでいる。
コグニティブとは「認知」の意味で、膨大なデータ(ビッグデータ)から、ルールと知識を抽出する。ここでいうルールとは「相関関係」で、人間が見落とすような「相関関係」も気づくことができる。たとえば、ビール買う人はオムツも買う傾向が強いとか。
つまり、コグニティブ・コンピュータは、「機械学習」と「気づく」がセットになった新しい問題解決システムなのだ。
ただし、コグニティブ・アーキテクチュアは、新しいものではない。概念や試作レベルのものはすでに存在した。IBM「ワトソン」が凄いのは、実用レベルに達したこと、普遍的な「認知」であること(様々の分野に転用可能)。
では、なぜ、コグニティブ・コンピュータは人工知能と言えないのか?
初歩的な知能の条件「言葉と概念のリンク」もできないから。
たとえば、「人型ロボット」という言葉をコンピュータに教えるとしよう。
属性は「機械」で、人間の「頭」、「胴体」、「手」、「足」を継承する・・・ところが、どれだけ教え込んでも、「記号」が積み上がるだけ。ロボットの「概念」を獲得したわけではない。
ロボットの概念?
「あいつは奥さんに頭が上がらないんだ。まるで『ロボット』だね」
人間ならピンとくるが、コンピュータにはサッパリ。ロボットという「言葉=記号」は知っているが、ロボットの「概念」を理解していないから。この場合、「人の言いなりになる」がイメージできないのである。
じつは、このような概念をコンピュータに理解させるのは難しい。明示的にルールとして与えられないから。
具体的に考えてみよう。
「人の言いなりになる」をすべてルールで記述できる?
ムリ。
ルールが定まらないと、プログラムを書くこともできない。人工知能の難しさはここにある。
ところが、人間には造作もないことだ。さらに、人間の脳は、発明・発見・創作までやってのける。これでは、人間なみの人工知能なんて100年はムリ?
ただし、個人的には、コグニティブ・コンピュータは「破壊的イノベーション」だと思っている。期待半分、脅威半分で。
前者は、人類文明が直面する複雑化の問題を解決してくれるだろう。
後者は、今後10~20年で、人間の仕事の半分を奪うだろう。専門性の低い単純作業だけではない。ルール化できる定型業務なら、知的業務も対象になる。具体的には、医療、法務、会計・税理、コールセンター・・・人間に残された仕事は、セラピスト、キャバ嬢?
そして、この分野でダントツがIBMのワトソンなのだ。ただし、やり方はやぼったい(洗練されていない)。古典的なルールベース、機械学習、最新のディープラーニングとあらゆる手法を取り込んでいる。まるでAI部品の総合商社だ。
一般に、このようなハイブリッドテクノロジーは短命である。見た目が悪く、モノリシックテクノロジー(一枚岩技術)に大きく劣るから。異質のテクノロジーを混在させると、オーバーヘッドが増大し、トータルパーフォーマンスが劣化するのだ。
たとえば、19世紀末から20世紀初頭に出現した「機帆船」。帆と蒸気機関のハイブリッド船で、見るからにブサイクだった(戦闘機をみればわかるが、カッコ良さとスペックは比例する)。
そもそも、帆と蒸気機関の2つの動力源を搭載するので、効率が悪い。蒸気機関が未成熟だったため、帆で補完したわけだ。ところが、洗練された内燃機関が出現すると、完全に淘汰された。つまり、ハイブリッドは過渡的なテクノロジーなのである。
とはいえ、風があれば帆で省エネ航海、無風なら蒸気機関で航海・・・は現実的なソリューションだろう。燃費の安定しない蒸気機関だけで航海すると、大海のど真ん中で燃料切れ。帆だけで航海すると、風がないと大海をふらふら・・・それよりはマシだろう。
早い話、その時のテクノロジーをつまみ食いして、goodenough(こんくらいで、いいんじゃない)で手を打つのが、ハイブリッドテクノロジーなのである。
つまり、スマートさより実用性。
じつは、これがIBMのお家芸なのである。複雑すぎてムリと、みんながあきらめる難儀なことを、この会社は力技でやり抜くのだ。
100年かけて積み上げたIT技術、年間売上高12兆円が生み出す巨大資本、そんなコンピュータ業界の王者が造り上げた怪物が「ワトソン」なのだ。
そして・・・
2015年12月現在、ソフトバンクはワトソンの日本語化をすすめている。日本語版ワトソンをペッパーにつなごうとしているのだ。そうなれば、ペッパーは日本語ペラペラ、会話はお手のもの?
ノー!
今のペッパーではムリ。
アプリ開発業者が非力だからではない。ペッパー・システムに根本的な問題があるのだ。
by R.B