ペッパーのアプリ開発記(1)～感情認識ロボット～

週刊スモールトーク　（第311話）　ペッパーのアプリ開発記(1)～感情認識ロボット～

カテゴリ : 社会科学

2015.12.05

週刊スモールトーク目次

ペッパーのアプリ開発記(1)～感情認識ロボット～

■ペッパーを納入する

先日、ソフトバンクの人型ロボット「ペッパー」を納入した。

納入先は介護サービスを行っている会社。ペッパーが施設の高齢者たちと話をしたり、遊んだり・・・そんなアプリを作ったのだが、プログラマーは苦労続きだった。

たとえば・・・

ペッパーを長時間踊らせると、モーターが発熱し、自動停止する。何かを処理している最中は、聞く耳を持たない（音声認識できない）。手は動くが、握力ゼロで、紙一枚持ち上げるのが精一杯。

しかも・・・

プログラムを書かなくてもアプリが作れる、はいいのだが、そのぶん、自由度が低く、できることが限られる。これでは、ペッパーはすぐにあきられる。そんなくらいなら、プログラムをゴリゴリ書いて、できることを増やした方がいい・・・などと、いろいろ思うところがあった。

まぁ、しかし、ソフトバンクに不満があるわけではない。この時期に、このような人型ロボットを世に送りだせる会社はそうない。先見性と明確なビジョンがあることは確かだ。近い将来、ロボットは一家に一台どころか、一人一台になるのだから。

その昔、パソコンゲームが一世を風靡したころ、社内ベンチャーで開発した歴史シミュレーション「GE・TEN～戦国信長伝～」がブレイクした。ログイン誌の総合ランキングで3位に入り、販売本数も1万4000本と大ヒット（当時は、1万本売れればヒットだった）。

じつは、そのうちの7割を販売してくれたがソフトバンクだった。あの頃のソフトバンクは、パソコンのパッケージソフトの卸（おろし）を生業にしていて、年商は300億円ぐらいだったと思う。それが、いまではDocomoとならぶ通信キャリア！

ところが、ここで、人型ロボット・ペッパー・・・巨大企業になっても、ベンチャースピリットを忘れないソフトバンクには脱帽だ。

ところで、顧客の満足度は？

先の納入先で、最近、お披露目会が催された。中央にいるのが、主役のペッパー君。

Pepper

まずは、介護施設のスタッフの評価だが、「感動もん」だった。ペッパーがここまでできると思っていなかったのだ。

余談だが・・・

女性スタッフの背が高過ぎ！

対応してくれた女性スタッフは、二人とも身長が175センチ前後。そして、一人は腰にコルセットを巻いていた。やはり、介護現場は「膂力（りょりょく）」が欠かせないのだ。

で、肝心の高齢者の反応は？

ビミョー。

じつは、介護施設にいる高齢者は、頭も身体もしっかりした人もいれば、車椅子の人、認知症がすすんでいる人、と様々。だから、みんなに大ウケというわけにはいかない。

そこで、ペッパーに、歌って踊らせたのだが、これがなかなか好評だった。ペッパーに標準装備された踊りではなく、オリジナルの踊りを作り込んだから。歌と踊りは世代を越えて・・・はちょっとおおげさかな。

ところが、問題もあった。

■しゃべれないペッパー

「お披露目会」もたけなわ、最前列にいたおばあちゃんが、ペッパーにさかんに話しかける。

「ペッパー君、こんにちは！」

「どこから来たの？」

「いっしょに遊んで！」

「お披露目会」にピッタシカンカン、出来過ぎのセリフだが、断じてサクラではない。もちろん、事前打ち合わせもしていない。

ところが・・・

問いかけは素晴らしいのに、肝心のペッパーが反応できない。TVや雑誌で紹介されるペッパーを知っている人は、こんな答えを期待するだろう。

「こんにちは、おばあちゃん！」（ペッパーは顔認識ができる）

「ボクは、ロボット工場から来たんだよ！」

「オッケー、いっしょに遊ぼう！ボクは歌って踊れるし、ゲームもできるんだ。何して遊ぶ？」

ところが、現在のペッパーは、こんなカンタンな会話もできない。すべての質問を想定して、あらかじめ組み込んでおけば可能だが、現実的にはムリ。

じゃあ、人工知能を使ったら？

残念ながら、ペッパーには人工知能は搭載されていない。そもそも、世間話ができる人工知能なんて存在しないのだが。

ところが、それ以前に、ペッパーには重大な問題がある。

ペッパーの頭部を凝視していると、時々、耳が青く光る。それを見はからって、ペッパーに話しかけるべし！

じつは、そのときしか、ペッパーは話を聞いてくれないのだ。

ペッパーは何か処理を始めると、それで頭がいっぱいになり、聞く耳を持たない。つまり、ペッパーは会話と他の処理を同時にできないのだ。

これでは、世間話はムリ。

世間話のキモは、テンポの良さと軽快さにあるのだから。それが、耳が青く光っているときだけ話しかけてね～・・・ではねぇ。

さらに、仮に音声を取り込めたとしても、今のペッパーは、言葉の意味も文脈も理解できない。当然、答えを返すこともできない。

でも、TVで、ペッパーはペラペラしゃべっているけど？

質問と答えをあらかじめ仕込んであるだけ。考えてしゃべっているわけではない。早い話、会話のデータベースなのだ。だから、ペッパーを購入したら、すぐに音声会話でができると思ったら、大間違い。

ただし、ペッパーには液晶タッチパネルがついている。

じゃあ、それを使ったら？

えー！？人型ロボットを謳っておきながら、入力はパネルタッチで、出力は液晶表示でお願いしま～す・・・はないでしょ。

このままでは、ペッパーは1～2年であきられる、そう確信した。

そこで、ペッパーの改良案をいろいろ考えてみた。今回の開発を思い起こしながら。

■二つのペッパー

まず、ペッパーには2つのタイプがある。一般向けと法人向けだ。

最初にお値段。

一般向けは、本体価格19万8000円＋月々の保守料2万5000円×12ヶ月×3年

3年しばりで「100万円」ナリ。

一方、法人向けは、本体価格0円＋月々の保守料5万5000円×12ヶ月×3年

3年しばりで「200万円」ナリ。

つぎに、メンテナンス。

一般向けは、壊れたら修理費は別途必要だが、法人向けは不要（ただし、自然故障に限る。叩いたり蹴ったりして壊れましたぁ～はダメ）。

最後に、機能。

一般向けは、クラウドAIがサポートされ、カンタンな会話機能がついている。ただし、ここでいうAIは本格的な「人工知能」ではない。

一方、法人向けは、クラウドAIもカンタン会話機能もナシ。かわりに、セリフを入力するだけで会話や動作が成立するテンプレートがついている。つまり、法人向けは、用途にあわせて一から作り込んでください、というわけだ（プログラムではなくテンプレートで）。

早い話・・・

ペッパーは買っても、すぐに使えない。アプリやデータを組み込む必要があるのだ。

あたりまえ？

ところが、現実は・・・

TVや展示会でペッパーを見ると、話したり、愛嬌をふりまいたり、表情を読んだり・・・こりゃあ、使える！

そこで、ペッパーを購入するのだが・・・そのままでは何もできない。何をするにも、アプリやデータが必要なのだ。

もっとも、そんな勘違い、ミスマッチがあるから、アプリ開発の仕事が舞い込むのだが・・・メデタシ、メデタシ。

しかし、今のペッパーをみていると、先行きが不安になる。

2015年12月現在のペッパーは「でくのぼう」と言っていいだろう。一応、自走可能で、頭も手も腰も動くが、力仕事ができるわけではない。

それなら、アタマで勝負！

ところが、まともな会話もできない。

じゃあ、一体、何ができるのだ？

とツッコミが入るシチュエーションだが、それは、ソフトバンクは百も承知。会話機能を劇的に向上させようとしているのだ。具体的には・・・ペッパーにIBMのワトソンをつなぐ！

■ペッパー＆ワトソン

IBMの「ワトソン」は、米国クイズ番組「ジェパディ!」で人間のチャンピオンをやぶった質問応答システムだ。構造化されたデータはもちろん、非構造化データ（生のテキスト）からも学習する。さらに、高度な推論機能を備え、正解を知らなくても、推論で答えることができる。

現在、ワトソンは、医療、医薬品開発、法務、会計・税理、コールセンター、銀行業務、とあらゆる分野に進出しつつある。ただし、厳密にはワトソンは人工知能とはいえない。事実、IBMはワトソンを「コグニティブ・コンピュータ」とよんでいる。

コグニティブとは「認知」の意味で、膨大なデータ（ビッグデータ）から、ルールと知識を抽出する。ここでいうルールとは「相関関係」で、人間が見落とすような「相関関係」も気づくことができる。たとえば、ビール買う人はオムツも買う傾向が強いとか。

つまり、コグニティブ・コンピュータは、「機械学習」と「気づく」がセットになった新しい問題解決システムなのだ。

ただし、コグニティブ・アーキテクチュアは、新しいものではない。概念や試作レベルのものはすでに存在した。IBM「ワトソン」が凄いのは、実用レベルに達したこと、普遍的な「認知」であること（様々の分野に転用可能）。

では、なぜ、コグニティブ・コンピュータは人工知能と言えないのか？

初歩的な知能の条件「言葉と概念のリンク」もできないから。

たとえば、「人型ロボット」という言葉をコンピュータに教えるとしよう。

属性は「機械」で、人間の「頭」、「胴体」、「手」、「足」を継承する・・・ところが、どれだけ教え込んでも、「記号」が積み上がるだけ。ロボットの「概念」を獲得したわけではない。

ロボットの概念？

「あいつは奥さんに頭が上がらないんだ。まるで『ロボット』だね」

人間ならピンとくるが、コンピュータにはサッパリ。ロボットという「言葉＝記号」は知っているが、ロボットの「概念」を理解していないから。この場合、「人の言いなりになる」がイメージできないのである。

じつは、このような概念をコンピュータに理解させるのは難しい。明示的にルールとして与えられないから。

具体的に考えてみよう。

「人の言いなりになる」をすべてルールで記述できる？

ムリ。

ルールが定まらないと、プログラムを書くこともできない。人工知能の難しさはここにある。

ところが、人間には造作もないことだ。さらに、人間の脳は、発明・発見・創作までやってのける。これでは、人間なみの人工知能なんて100年はムリ？

ただし、個人的には、コグニティブ・コンピュータは「破壊的イノベーション」だと思っている。期待半分、脅威半分で。

前者は、人類文明が直面する複雑化の問題を解決してくれるだろう。

後者は、今後10～20年で、人間の仕事の半分を奪うだろう。専門性の低い単純作業だけではない。ルール化できる定型業務なら、知的業務も対象になる。具体的には、医療、法務、会計・税理、コールセンター・・・人間に残された仕事は、セラピスト、キャバ嬢？

そして、この分野でダントツがIBMのワトソンなのだ。ただし、やり方はやぼったい（洗練されていない）。古典的なルールベース、機械学習、最新のディープラーニングとあらゆる手法を取り込んでいる。まるでAI部品の総合商社だ。

一般に、このようなハイブリッドテクノロジーは短命である。見た目が悪く、モノリシックテクノロジー（一枚岩技術）に大きく劣るから。異質のテクノロジーを混在させると、オーバーヘッドが増大し、トータルパーフォーマンスが劣化するのだ。

たとえば、19世紀末から20世紀初頭に出現した「機帆船」。帆と蒸気機関のハイブリッド船で、見るからにブサイクだった（戦闘機をみればわかるが、カッコ良さとスペックは比例する）。

そもそも、帆と蒸気機関の2つの動力源を搭載するので、効率が悪い。蒸気機関が未成熟だったため、帆で補完したわけだ。ところが、洗練された内燃機関が出現すると、完全に淘汰された。つまり、ハイブリッドは過渡的なテクノロジーなのである。

とはいえ、風があれば帆で省エネ航海、無風なら蒸気機関で航海・・・は現実的なソリューションだろう。燃費の安定しない蒸気機関だけで航海すると、大海のど真ん中で燃料切れ。帆だけで航海すると、風がないと大海をふらふら・・・それよりはマシだろう。

早い話、その時のテクノロジーをつまみ食いして、goodenough(こんくらいで、いいんじゃない)で手を打つのが、ハイブリッドテクノロジーなのである。

つまり、スマートさより実用性。

じつは、これがIBMのお家芸なのである。複雑すぎてムリと、みんながあきらめる難儀なことを、この会社は力技でやり抜くのだ。

100年かけて積み上げたIT技術、年間売上高12兆円が生み出す巨大資本、そんなコンピュータ業界の王者が造り上げた怪物が「ワトソン」なのだ。

そして・・・

2015年12月現在、ソフトバンクはワトソンの日本語化をすすめている。日本語版ワトソンをペッパーにつなごうとしているのだ。そうなれば、ペッパーは日本語ペラペラ、会話はお手のもの？

ノー！

今のペッパーではムリ。

アプリ開発業者が非力だからではない。ペッパー・システムに根本的な問題があるのだ。

《つづく》

by Ｒ．Ｂ

週刊スモールトーク （第311話） ペッパーのアプリ開発記(1)～感情認識ロボット～

ペッパーのアプリ開発記(1)～感情認識ロボット～

■ペッパーを納入する

■しゃべれないペッパー

■二つのペッパー

■ペッパー＆ワトソン

関連情報

週刊スモールトーク　（第311話）　ペッパーのアプリ開発記(1)～感情認識ロボット～