BeneDict 地球歴史館

BeneDict 地球歴史館
menu

スモールトーク雑記

■データサイエンティストの時代 2018.04.15

今一番イケてる職業は、データサイエンティストかもしれない。

AIと統計学を駆使し、問題解決する。聞こえはいいが、実入りもいい。1人月150万円・・・1ヶ月働いたら150万円ゲット、ITのSE(システムエンジニア)の2倍だ。

ところが、「1人月150万円」でも確保できないという。それほど、データサイエンティストは不足している。

かつて、花形職業といえば、金融のトレーダーだった。米国では、年収「ん千万円」はザラで、数十億円稼ぐ神もいた。

ところが・・・

この10年で、トレーダーはAIに取って代わられた。

たとえば、世界最大最強の金融会社ゴールドマン・サックス。600人いたトレーダーが2人に・・・リストラなんて生やさしいものではない。空いたイスには、200人のAIエンジニアが座っているという。ちなみに、その頂点に立つのはデータサイエンティスト。

ところで、データサイエンティストって、一体何者?

名探偵シャーロック・ホームズ。

証拠(データ)から、犯人(真実)を見つけ出し、逮捕(解決)する。

ただし、シャーロック・ホームズは「犯罪」専門だが、データサイエンティストの守備範囲は広い。政治、経済、軍事、経営の意思決定から、現場のモノづくりやサービスまで。

具体的には・・・膨大なデータから、ルールや知見を見つけだし、それにもとづいて、問題解決する。昔は統計的手法に頼っていたが、今はAI(機械学習)が主流だ。コンピュータパワーが劇的に増大し、実用に耐えるようになったのだ。

先日、データサイエンティストのSさんと会食した。

Sさんは、現役のデータサイエンティストだ。複数の会社とコンサルタント契約し、実務も請け負っている。

Sさんの話で、心に残る話が2つあった。

一つは、レタスを改良する農業プロジェクト。

これまで、レタス栽培は農業従事者の経験とカンにたよっていた。それを統計的手法と機械学習を駆使し、「140グラム」のレタスを作ったという。JAの規格は「90グラム」なので、大成功!

と思いきや、玉がデカくなったぶん、輸送コストが増え、スーパーの展示スペースも大きくなる、それが問題なのだという。

つまり・・・

商品だけでなく、輸送、展示までふくめた最適解が求められる。じつは、今のAI(機械学習)は、栽培、輸送、展示など、異なるフォーマットのデータをいっしょくたに学習できない。つまり専門バカ。というわけで、当面は、AIだけで自己完結はムリ。データサイエンティストが欠かせない。

心に残った二つ目・・・

「公理」は変えないけど「定理」は変える・・・脳天直撃ですね。

「公理」とは最も基本的な仮定。たとえは、三角形の内角の和は180度。一方、「定理」とは公理や他の定理から導かれた命題。たとえば、ピタゴラスの定理。

公理を疑ったら、何も始まらないので、そこは変えない。でも、そこから導き出される「定理」はガンガン変えるという。ピタゴラスの定理もひっくり返す・・・大胆不敵ですね。

データサイエンティストは「データ」を重視する。

はじめにデータありきで、そこから、新しい定理(ルール)を導き出す。それが従来の定理と違っていたら、定理を変える、というのだ。

データサイエンティストは、発想も思考も「データドリブン(データ駆動)」。すべて、エビデンス(データ)をよりどころにする。定理(常識)さえ疑ってかかるのだから。

じつは、知人にもう一人、データサイエンティストがいる。3年前に、知り合ったKさんだ。

不思議なことに、この2人には驚くほど共通点がある。

1.高学歴(米国の一流大学を卒業)

2.スマート(幅広い教養をもち、思考の連鎖が長い)

3.思考がニュートラル(バイアスがかかっていない)

4.データドリブン(発想も思考もデータ駆動)

5.歴史と地理に詳しい(Kさんは米国アイビーリーグの地理学の博士課程卒)。

6.農業のAI化に興味をもっている(これは偶然かも)

とくに「歴史と地理に詳しい」は重要だ。「地政学」に精通、を意味するから。つまり、俯瞰する、鳥瞰する、に長けている。

ところが、日本に「地政学」をちゃんと教える大学はない。だから、国家ビジョンや戦略が描けないのだ。ロシアのプーチン、中国の習近平、アメリカトランプにいいようにやられているのはそのせい?やっぱり、米国の大学でないとダメなのかぁ~、もう遅いけど。

というわけで、これがデータサイエンティストの「条件」と言い張るつもりはないが、「傾向」といえるかもしれない。

ふつう、「真実」へのアプローチは2つある。

データから真実をあぶりだす「帰納法」と、論理をつないで推論する「演繹法」だ。

もちろん、SさんもKさんも帰納法。データしか信じていないから。事実、2人の話は、エビデンスがハッキリしていて、筋が通っていて、偏りがなく、聞いていて気持ちがいい。

というわけで、案外、演繹法は「妄想」なのかもしれない。

by R.B

関連情報