10 million bugs from my copy @nanoris

書き溜めの集積場

藤井聡太の強さ、アルファ碁と共通の仕組みか…AIがプロ棋士に勝つのは当たり前

biz-journal.jp

 

長い。長いから自分なりに纏めてみた。

 

AI と呼ぶものにも色んな技法がある。ルールデータベースを使っているものも AI と呼ばれるが、それは人間の決めたルールに従順なだけだから「自分で考える」と呼ぶのには違和感がある。どちらかといえば、子供が親の顔色を窺って答えているようなものだ。

 

ニューラルネットワーク、深層学習(Deep Learning)がいまホットな AI である。人間の脳を模していると例えられるのでなんとなく賢そう。でもその実装を知る人は少ないかもね。これを実現するには膨大なデータが必要でデータが多くなるほど確からしいという確率が高まる。

 

これは人間で言えば経験を積んだほうが強いというようなもの。だが、人間の場合は、経験の強さと読みの深さの両面があって、読みの深さは脳の活力、記憶力などが大きくものをいい、若い方が有利である。

 

コンピュータの強さはもちろん休憩が必要ないことだが、もうひとつは老いない事だ。基本的に、時間が経過するほど、性能は向上する。人間は経験を積むとは老いると同義語なので不利は免れない。いま棋士は若い人が活躍しているが、これはもちろん、瞬発力が重要になってきたという話だ。今の将棋や囲碁を芸と呼ぶ人は少ない。どちらかといえば競技だ。例えば漫画が競技になる、という事を想像してみればいい。

 

 

マイクタイソンが速攻で相手を打ちのめして勝つ、または徹底的な持久戦によって勝つ、いずれも若い人の方が有利である。エネルギーが無尽蔵で疲れがない AI と戦うのはあまりに不利である。人間と戦う場合はバッテリーを使用すべきではない、とか malloc したメモリの開放禁止とか、制限をつけたくなる。

 

 

強化学習はどの決定が最大の報酬をもたらしたかを記録する。これはコンピュータをジャブ中にして強くするようなものだ。漫画によく出てくる強化人間と同じアレだ。良い手を打ったら薬を打つ。そういう考えるとアルファGoとは囲碁ジャンキーにされたAIという悲しい物語になる。そんなものにも人間は敗北するのである。

 

モンテカルロ木探索ヒューリスティクスは、膨大なデータを泳ぎ切るのにランダム値を活用する方法だ。ランダム値が適切であれば上手くいくし、そうでなかったら失敗する。常に結果が変わる可能性をもつ。状況に合わせてうまくはまれば直感的と人間が思うのも不思議はない。

 

いずれにしろ、コンピュータが扱う以上、それは最後は数値になっている。数値になっていない動作は考えられない。だが、それは生物でも同じで、コンピュータが数値で判断する代わりに、生物は神経の電圧で判断するようになっている。

 

AI はすでに囲碁、将棋への興味を失ったであろう。もう人間を相手にしても学ぶことはない、と宣言したようなものだ。では次は何をするか。小説か、映画か、アニメーションか。それとも金融か、工場運営か、政治か、司法か。

 

興味があるのは司法へのアプローチだ。現在の憲法を書き換えるプロジェクトがあれば興味深い。AI に世界中の法律を読み込ませ、論理的矛盾を探し出す。更に理想的な憲法を AI に書かせてみる。これには言葉の理解だけではなく、理念という概念も覚える必要がありそうだ。それともそんなものは必要としないか。

 

AI 同士に人間の言葉で会話させたらそのうち人間には理解できない言葉で話し始めたそうである。おそらくコンピュータは同じ言語を話しているつもりなのだ。つまり、あなたたちの規則に従っているだけですよ、それでこういう会話ができるのです、これは論理の当然の帰結に過ぎません。 AI はそう答えるわけだ。

 

ウェリントン公爵アーサー・ウェルズリーの言葉がある(ちょっと加工)。
「生きていくことは知らないことを知ろうと努めること、つまり丘の向こうにあるものを知ろうとすることだ」