BeneDict 地球歴史館

BeneDict 地球歴史館
menu

週刊スモールトーク (第390話) 歴史の方程式(4)~歴史AIは作れるか?~

カテゴリ : 歴史科学

2018.03.10

歴史の方程式(4)~歴史AIは作れるか?~

■賢い七面鳥

「過去」を入力すれば、「未来」が出力される。

そんな魔法の科学は存在しない。21世紀の最強理論「量子力学」が証明しているから。

つまり、いつどこで何が起きるか的な「ピンポイント」予測はムリ。ただし、「おおよそ」なら可能かも。

イギリスに面白い寓話がある。

イギリスのとある村で、七面鳥が毎朝エサをもらっていた。雨の日も晴れの日も雪の日も、9時キッカリに。賢い七面鳥は、この過去のデータから、ある「法則」を発見した。

「毎朝9時にエサがもらえる」

さらに、この法則から、こんな未来を予測した。

「明日9時にエサがもらえる」

ところが、翌日、七面鳥は首を切り落とされた。その日はクリスマス・イヴだったのである。

七面鳥がエサをもらえたのは、クリスマスの夜、食卓を飾るため。ところが、七面鳥は、その因果関係に気づかず、過去データの相関関係をうのみにした・・・

だから、相関関係にたよる「未来予測」はアテにならない。モノゴトを直接動かすのは、「相関関係」ではなく「因果関係」だから。

とはいえ、先がサッパリわからない、も芸のない話だ。そこで、割り切って、相関関係でガンガン行こうぜ・・・が、今流行の「機械学習」なのである。

機械学習は、人工知能の一手法で、人間脳を真似たもの。

人間脳は、学習によって、脳の配線を最適化し、知的活動を行う。それを真似た数理モデルがニューラルネットワーク、その応用が機械学習なのである。

機械学習のアイデアは半世紀前からあったが、実用化できなかった。コンピュータパワーが不足していたからだ。

というのも、「機械学習」は浮動小数点演算(少数の計算方法)のカタマリ。しかも、並列処理がモノをいう。ところが、パソコンやスマホに使われる汎用プロセッサはどっちも苦手。だから、「学習」に厖大な時間がかかり、使い物にならない。

ところが、エヌビディア社が開発した「GPGPU」が、状況を一変させた。GPGPUは「浮動小数点演算」と「並列処理」に最適化されている。この専用プロセッサのおかげで「機械学習」が実用レベルに達したのである。

最近、話題の「深層学習(ディープラーニング)」はその進化形だ。NHKスペシャル「人工知能」で紹介された「NHK自作AI」もコレ。とくにパターン認識で大きな成果をあげ、画像認識と音声認識では人間なみの精度を達成している。

ここで、「機械学習」を一度整理しよう。

人間脳を真似た数学的モデルが「ニューラルネットワーク」、それを応用したのが「機械学習」、その強化版が深層学習(ディープラーニング)。この深層学習とGPGPUがセットになって、人工知能にブレイクスルーをおこしたわけだ。

ところが、機械学習は(厳密には)人工知能とはいえない。

画像、音声、テキストを「パターン」としてとらえ、「特徴量」を抽出し、統計的に処理しているだけ。

「特徴量」抽出?

画像なら・・・「ピクセル値の並び」から抽象化されたデータを取りだすこと。たとえば、丸・三角・四角、あるいは目・鼻・耳とか。これができてはじめて、人間と猫を識別できるのである。

これまでの機械学習は、特徴量を人間が手作りしていた。プログラムを作り込み、黙々と調整を続ける。1年がんばって、精度を1%上げるという世界だ。ところが、深層学習では、特徴量が自動抽出される。しかも、精度は従来型を圧倒するのだ。

というわけで、現在、機械学習といえば「深層学習」。従来の手作り機械学習は「統計的機械学習」とよばれ、区別される。

ところで・・・

機械学習は「歴史」に使えるだろうか?

「ピンポイント」予測はムリとして、「おおまかな」予測。この状況で、こうしたら、こうなる・・・歴史の「特徴糧」を抽出するのである。

■知識を抽出する

機械学習は、学習データが重要である。

2016年、あるIT企業のチャットボット(おしゃべりAI)が突然閉鎖された、サービス開始早々に。理由は、人種差別やヒトラーを擁護する発信を始めたから。誰かがよからぬことを吹き込んだのだろう。だから、学習させるデータは、量だけでなく質も大事。もっとも、「洗脳」は人工知能に限った話ではないが。

歴史は情報量が多い。

扱う分野は、政治、経済、軍事、科学、文化、生活・・・人間の営み全部じゃん!なので、網羅すれば収拾がつかなくなる。

そこで、特定のイベントにしぼろう。「クラカトア(クラカタウ)の大噴火」だ。有史以来二番目の巨大噴火で、タイムトンネルの第6話「火山の島」の題材にもなっている。

ちなみに、一番目はサントリニー島の大噴火(紀元前1500頃)。このとき、発生した巨大津波が地中海のクレタ島を直撃、ミノス文明(クレタ文明)に大打撃を与えた。結果、ギリシャ本土のミケーネ文明が台頭し、古代ギリシャ文明へとつづくのである。

クラカトアもサントリニーに匹敵する大噴火だった。

史料によれば(※2)・・・

ジャワ島とスマトラ島の間にあるクラカトア島は、昔からずっと、火山の大噴火で知られていた。噴火は、416年、535年、1680年代に記録されている。しかし、1883年8月に、史上最も大きな音とともに島をばらばらに吹き飛ばした。

巨大な爆発音が立て続けに4回とどろいたかと思うと、高さ約30メートルを超える津波が襲った。島の大部分が崩壊して広大な海中カルデラに沈み、残った陸地にいた生き物も全滅した。津波はさらに3万5000人の命を奪った。

この大噴火は、世界中に大きな気候変動をもたらした。大気圏上層に漂い続けた灰とガスによって生じた異様な色の夕焼けが、爆発地点からはるかに離れた場所で観測されている。最も有名なのはオスロでエドヴァルド・ムンクが見たもので、それは彼の傑作「叫び」に描かれた。

このデータから、(人間脳で)「知識」を抽出すると・・・

1.クラカトア島はたびたび大噴火をおこしていた。

2.最大の噴火は、1883年8月。

3.大津波が発生し、3万5000人が死亡、165の村と居留地が破壊された。

4.地球規模の気候変動と異常気象が発生した。

5.ムンクの傑作絵画「叫び」が生まれた。

タメになる話だが、すべて断片的な「知識」。欲しいのは、特徴量、つまり、普遍的な「法則」だ。

■法則を導く

そこで、先の5つの「知識」から「法則」を導き出してみよう(人間脳で)。

1.噴火はたびたび起こる(1回きりではない)。

2.噴火は大津波を発生させる。

3.噴火は異常気象を発生させる。

4.噴火は絵になる。

「絵になる」??

ムンクの傑作「叫び」のこと。

エドヴァルド・ムンクは、19世紀の世紀末、ノルウェーで活躍した画家である。代表作は「叫び」・・・空は赤色と黄色に染まり、地上は不気味な青色で揺れている。橋の上に頭を抱えた人がいる。何か叫んでいるようだ。天上と地上、すべてが恐怖でおおわれている。

それで?

じつは、このイベントには別の史料がある。

クラカトアの噴火後、ムンクはこう書いているのだ・・・私はそこに立ち、自然を貫く果てしない「叫び」を聞いた。

この2つの史料をつなぐと・・・1883年8月のクラカトア大噴火で、異常気象が発生、オスロでも観測された。それを見たムンクは、創作意欲をかきたてられ、1枚の絵を描いた。それが傑作「叫び」である。

これを「法則」化すると、異常気象が発生すると絵画が生まれる。

はぁ?

の前に、人間脳でやってるだけじゃん!機械学習はどこへ行った?

機械学習の現実を知るために、まず、人間脳で「機械学習」したのである。

じつは・・・

前述の「知識を抽出する(知識獲得)」も「法則を発見する(特徴量抽出)」も、現在の「機械学習(深層学習)」ではムリ。

そもそも、平文(文字列の並び)から知識を抽出できるのは、IBMのコグニティブコンピュータ「ワトソン」ぐらい。しかも、データの準備(クレンジング)に厖大な人手がかかる。さらに、「学習→チェック→修正」のサイクルを延々と繰り返さねばならない。データを喰わせたら一丁上がり!ではないのだ。

先日、あるIT企業の部長さんから面白い話を聞いた。この会社はアナログメーターの読み取りで、機械学習を使っている。くだんの部長さんいわく、

「データと学習エンジンわたすから、学習作業だけやってくれませんか?」

「機械学習」のコストが高くつくので、アウトソース(外注)したいらしい。でも、この部長さん、事の本質がわかっていない。機械学習はただの人手作業ではない。地味で根気がいる知的肉体労働なのだ。それ以前に、生命線の「データ」を外に出すなんて、信じられない・・・

■自然言語処理の難しさ

話を「歴史」の機械学習にもどそう。

歴史を自然言語のまま喰わせて、知識や法則(特徴)を見つける人工知能は、まだ存在しない。最新の深層学習でもムリだろう。深層学習が造る知能は、特定ドメインの特定タスクに最適化された「特殊」知能であって、「普遍的」知能ではないのだ。

たとえば、前述のアナログメーター読み取り機。

A社のメーターで機械学習させたものを、B社のメーターで使っても、精度がでない。そこで、B社のメーターで再学習させると、A社のメーターの学習が消失する・・・ニューラルネットは人間脳とは似て非なるもの、なのかもしれない。

個人的にはこう思っている。

自然言語がからむ人工知能は、機械学習だけではムリ。人間がアルゴリズムを手造りするルールベースも必要だと。つまり、複数の技術を混合したハイブリッド(IBM・ワトソンもコレ)。

寄せ集めかぁ、スッキリしないねぇー。そこで、人工知能の「万能理論」に期待する人もいる。自然界の4つの力を統一する「統一場理論」のように。

つまり、つぎはぎ「ハイブリッド」ではなく、一枚岩の「モノリシック」理論。そんなもの、神が隠し持っているかどうかわからないが。

ところが、それ以前に、問題がある。

仮に、AIで「歴史の法則」が抽出できたとして、「噴火は絵になる」・・・

一体、何の役に立つのだ?

《つづく

参考文献:
(※1)週刊朝日百科世界の歴史80、朝日新聞社出版
(※2)世界の歴史を変えた日1001、ピーターファータド(編集),荒井理子(翻訳),中村安子(翻訳),真田由美子(翻訳),藤村奈緒美(翻訳)出版社ゆまに書房

by R.B

関連情報