BeneDict 地球歴史館

BeneDict 地球歴史館
menu

週刊スモールトーク (第311話) ペッパーのアプリ開発記(1)~感情認識ロボット~

カテゴリ : 社会科学

2015.12.05

ペッパーのアプリ開発記(1)~感情認識ロボット~

■ペッパーを納入する

先日、ソフトバンクの人型ロボット「ペッパー」を納入した。

納入先は介護サービスを行っている会社。ペッパーが施設の高齢者たちと話をしたり、遊んだり・・・そんなアプリを作ったのだが、プログラマーは苦労続きだった。

たとえば・・・

ペッパーを長時間踊らせると、モーターが発熱し、自動停止する。何かを処理している最中は、聞く耳を持たない(音声認識できない)。手は動くが、握力ゼロで、紙一枚持ち上げるのが精一杯。

しかも・・・

プログラムを書かなくてもアプリが作れる、はいいのだが、そのぶん、自由度が低く、できることが限られる。これでは、ペッパーはすぐにあきられる。そんなくらいなら、プログラムをゴリゴリ書いて、できることを増やした方がいい・・・などと、いろいろ思うところがあった。

まぁ、しかし、ソフトバンクに不満があるわけではない。この時期に、このような人型ロボットを世に送りだせる会社はそうない。先見性と明確なビジョンがあることは確かだ。近い将来、ロボットは一家に一台どころか、一人一台になるのだから。

その昔、パソコンゲームが一世を風靡したころ、社内ベンチャーで開発した歴史シミュレーション「GE・TEN~戦国信長伝~」がブレイクした。ログイン誌の総合ランキングで3位に入り、販売本数も1万4000本と大ヒット(当時は、1万本売れればヒットだった)。

じつは、そのうちの7割を販売してくれたがソフトバンクだった。あの頃のソフトバンクは、パソコンのパッケージソフトの卸(おろし)を生業にしていて、年商は300億円ぐらいだったと思う。それが、いまではDocomoとならぶ通信キャリア!

ところが、ここで、人型ロボット・ペッパー・・・巨大企業になっても、ベンチャースピリットを忘れないソフトバンクには脱帽だ。

ところで、顧客の満足度は?

先の納入先で、最近、お披露目会が催された。中央にいるのが、主役のペッパー君。

Pepper

まずは、介護施設のスタッフの評価だが、「感動もん」だった。ペッパーがここまでできると思っていなかったのだ。

余談だが・・・

女性スタッフの背が高過ぎ!

対応してくれた女性スタッフは、二人とも身長が175センチ前後。そして、一人は腰にコルセットを巻いていた。やはり、介護現場は「膂力(りょりょく)」が欠かせないのだ。

で、肝心の高齢者の反応は?

ビミョー。

じつは、介護施設にいる高齢者は、頭も身体もしっかりした人もいれば、車椅子の人、認知症がすすんでいる人、と様々。だから、みんなに大ウケというわけにはいかない。

そこで、ペッパーに、歌って踊らせたのだが、これがなかなか好評だった。ペッパーに標準装備された踊りではなく、オリジナルの踊りを作り込んだから。歌と踊りは世代を越えて・・・はちょっとおおげさかな。

ところが、問題もあった。

■しゃべれないペッパー

「お披露目会」もたけなわ、最前列にいたおばあちゃんが、ペッパーにさかんに話しかける。

「ペッパー君、こんにちは!」

「どこから来たの?」

「いっしょに遊んで!」

「お披露目会」にピッタシカンカン、出来過ぎのセリフだが、断じてサクラではない。もちろん、事前打ち合わせもしていない。

ところが・・・

問いかけは素晴らしいのに、肝心のペッパーが反応できない。TVや雑誌で紹介されるペッパーを知っている人は、こんな答えを期待するだろう。

「こんにちは、おばあちゃん!」(ペッパーは顔認識ができる)

「ボクは、ロボット工場から来たんだよ!」

「オッケー、いっしょに遊ぼう!ボクは歌って踊れるし、ゲームもできるんだ。何して遊ぶ?」

ところが、現在のペッパーは、こんなカンタンな会話もできない。すべての質問を想定して、あらかじめ組み込んでおけば可能だが、現実的にはムリ。

じゃあ、人工知能を使ったら?

残念ながら、ペッパーには人工知能は搭載されていない。そもそも、世間話ができる人工知能なんて存在しないのだが。

ところが、それ以前に、ペッパーには重大な問題がある。

ペッパーの頭部を凝視していると、時々、耳が青く光る。それを見はからって、ペッパーに話しかけるべし!

じつは、そのときしか、ペッパーは話を聞いてくれないのだ。

ペッパーは何か処理を始めると、それで頭がいっぱいになり、聞く耳を持たない。つまり、ペッパーは会話と他の処理を同時にできないのだ。

これでは、世間話はムリ。

世間話のキモは、テンポの良さと軽快さにあるのだから。それが、耳が青く光っているときだけ話しかけてね~・・・ではねぇ。

さらに、仮に音声を取り込めたとしても、今のペッパーは、言葉の意味も文脈も理解できない。当然、答えを返すこともできない。

でも、TVで、ペッパーはペラペラしゃべっているけど?

質問と答えをあらかじめ仕込んであるだけ。考えてしゃべっているわけではない。早い話、会話のデータベースなのだ。だから、ペッパーを購入したら、すぐに音声会話でができると思ったら、大間違い。

ただし、ペッパーには液晶タッチパネルがついている。

じゃあ、それを使ったら?

えー!?人型ロボットを謳っておきながら、入力はパネルタッチで、出力は液晶表示でお願いしま~す・・・はないでしょ。

このままでは、ペッパーは1~2年であきられる、そう確信した。

そこで、ペッパーの改良案をいろいろ考えてみた。今回の開発を思い起こしながら。

■二つのペッパー

まず、ペッパーには2つのタイプがある。一般向けと法人向けだ。

最初にお値段。

一般向けは、本体価格19万8000円+月々の保守料2万5000円×12ヶ月×3年

3年しばりで「100万円」ナリ。

一方、法人向けは、本体価格0円+月々の保守料5万5000円×12ヶ月×3年

3年しばりで「200万円」ナリ。

つぎに、メンテナンス。

一般向けは、壊れたら修理費は別途必要だが、法人向けは不要(ただし、自然故障に限る。叩いたり蹴ったりして壊れましたぁ~はダメ)。

最後に、機能。

一般向けは、クラウドAIがサポートされ、カンタンな会話機能がついている。ただし、ここでいうAIは本格的な「人工知能」ではない。

一方、法人向けは、クラウドAIもカンタン会話機能もナシ。かわりに、セリフを入力するだけで会話や動作が成立するテンプレートがついている。つまり、法人向けは、用途にあわせて一から作り込んでください、というわけだ(プログラムではなくテンプレートで)。

早い話・・・

ペッパーは買っても、すぐに使えない。アプリやデータを組み込む必要があるのだ。

あたりまえ?

ところが、現実は・・・

TVや展示会でペッパーを見ると、話したり、愛嬌をふりまいたり、表情を読んだり・・・こりゃあ、使える!

そこで、ペッパーを購入するのだが・・・そのままでは何もできない。何をするにも、アプリやデータが必要なのだ。

もっとも、そんな勘違い、ミスマッチがあるから、アプリ開発の仕事が舞い込むのだが・・・メデタシ、メデタシ。

しかし、今のペッパーをみていると、先行きが不安になる。

2015年12月現在のペッパーは「でくのぼう」と言っていいだろう。一応、自走可能で、頭も手も腰も動くが、力仕事ができるわけではない。

それなら、アタマで勝負!

ところが、まともな会話もできない。

じゃあ、一体、何ができるのだ?

とツッコミが入るシチュエーションだが、それは、ソフトバンクは百も承知。会話機能を劇的に向上させようとしているのだ。具体的には・・・ペッパーにIBMのワトソンをつなぐ!

■ペッパー&ワトソン

IBMの「ワトソン」は、米国クイズ番組「ジェパディ!」で人間のチャンピオンをやぶった質問応答システムだ。構造化されたデータはもちろん、非構造化データ(生のテキスト)からも学習する。さらに、高度な推論機能を備え、正解を知らなくても、推論で答えることができる。

現在、ワトソンは、医療、医薬品開発、法務、会計・税理、コールセンター、銀行業務、とあらゆる分野に進出しつつある。ただし、厳密にはワトソンは人工知能とはいえない。事実、IBMはワトソンを「コグニティブ・コンピュータ」とよんでいる。

コグニティブとは「認知」の意味で、膨大なデータ(ビッグデータ)から、ルールと知識を抽出する。ここでいうルールとは「相関関係」で、人間が見落とすような「相関関係」も気づくことができる。たとえば、ビール買う人はオムツも買う傾向が強いとか。

つまり、コグニティブ・コンピュータは、「機械学習」と「気づく」がセットになった新しい問題解決システムなのだ。

ただし、コグニティブ・アーキテクチュアは、新しいものではない。概念や試作レベルのものはすでに存在した。IBM「ワトソン」が凄いのは、実用レベルに達したこと、普遍的な「認知」であること(様々の分野に転用可能)。

では、なぜ、コグニティブ・コンピュータは人工知能と言えないのか?

初歩的な知能の条件「言葉と概念のリンク」もできないから。

たとえば、「人型ロボット」という言葉をコンピュータに教えるとしよう。

属性は「機械」で、人間の「頭」、「胴体」、「手」、「足」を継承する・・・ところが、どれだけ教え込んでも、「記号」が積み上がるだけ。ロボットの「概念」を獲得したわけではない。

ロボットの概念?

「あいつは奥さんに頭が上がらないんだ。まるで『ロボット』だね」

人間ならピンとくるが、コンピュータにはサッパリ。ロボットという「言葉=記号」は知っているが、ロボットの「概念」を理解していないから。この場合、「人の言いなりになる」がイメージできないのである。

じつは、このような概念をコンピュータに理解させるのは難しい。明示的にルールとして与えられないから。

具体的に考えてみよう。

「人の言いなりになる」をすべてルールで記述できる?

ムリ。

ルールが定まらないと、プログラムを書くこともできない。人工知能の難しさはここにある。

ところが、人間には造作もないことだ。さらに、人間の脳は、発明・発見・創作までやってのける。これでは、人間なみの人工知能なんて100年はムリ?

ただし、個人的には、コグニティブ・コンピュータは「破壊的イノベーション」だと思っている。期待半分、脅威半分で。

前者は、人類文明が直面する複雑化の問題を解決してくれるだろう。

後者は、今後10~20年で、人間の仕事の半分を奪うだろう。専門性の低い単純作業だけではない。ルール化できる定型業務なら、知的業務も対象になる。具体的には、医療、法務、会計・税理、コールセンター・・・人間に残された仕事は、セラピスト、キャバ嬢?

そして、この分野でダントツがIBMのワトソンなのだ。ただし、やり方はやぼったい(洗練されていない)。古典的なルールベース、機械学習、最新のディープラーニングとあらゆる手法を取り込んでいる。まるでAI部品の総合商社だ。

一般に、このようなハイブリッドテクノロジーは短命である。見た目が悪く、モノリシックテクノロジー(一枚岩技術)に大きく劣るから。異質のテクノロジーを混在させると、オーバーヘッドが増大し、トータルパーフォーマンスが劣化するのだ。

たとえば、19世紀末から20世紀初頭に出現した「機帆船」。帆と蒸気機関のハイブリッド船で、見るからにブサイクだった(戦闘機をみればわかるが、カッコ良さとスペックは比例する)。

そもそも、帆と蒸気機関の2つの動力源を搭載するので、効率が悪い。蒸気機関が未成熟だったため、帆で補完したわけだ。ところが、洗練された内燃機関が出現すると、完全に淘汰された。つまり、ハイブリッドは過渡的なテクノロジーなのである。

とはいえ、風があれば帆で省エネ航海、無風なら蒸気機関で航海・・・は現実的なソリューションだろう。燃費の安定しない蒸気機関だけで航海すると、大海のど真ん中で燃料切れ。帆だけで航海すると、風がないと大海をふらふら・・・それよりはマシだろう。

早い話、その時のテクノロジーをつまみ食いして、goodenough(こんくらいで、いいんじゃない)で手を打つのが、ハイブリッドテクノロジーなのである。

つまり、スマートさより実用性。

じつは、これがIBMのお家芸なのである。複雑すぎてムリと、みんながあきらめる難儀なことを、この会社は力技でやり抜くのだ。

100年かけて積み上げたIT技術、年間売上高12兆円が生み出す巨大資本、そんなコンピュータ業界の王者が造り上げた怪物が「ワトソン」なのだ。

そして・・・

2015年12月現在、ソフトバンクはワトソンの日本語化をすすめている。日本語版ワトソンをペッパーにつなごうとしているのだ。そうなれば、ペッパーは日本語ペラペラ、会話はお手のもの?

ノー!

今のペッパーではムリ。

アプリ開発業者が非力だからではない。ペッパー・システムに根本的な問題があるのだ。

《つづく》

by R.B

関連情報