社会・政治

人工知能「ChatGPT」はどんな「学び」をしたのか…機械学習とディープラーニング

社会・政治　投稿日：2023.08.27 11:00FLASH編集部

写真・AC

　人工知能の進化が止まらない。ブームを勃興させる原動力になったのは機械学習だ。AIはルールによって動く。そこは間違いない。奇想天外な別の方法で動き出したわけではない。

　ルール間の調整をする作業がおっそろしく膨大で、しち面倒だったのが、訓練用の学習データを与えれば自動で（場合によってはルールを作るところまで）やってくれるようになった。開発者が楽をできる意味において大進歩である。

【関連記事：独走ソフトバンクを支えるバックネット裏の「人工知能兵器」】

　もちろん、そのための枠組みを作ったり、学習データを用意したり、学んだ結果を検証したりと開発者は血尿不可避なほどに忙しいのだが、それでも一番大変な部分が自動化されたことは極めて大きなインパクトをもたらした。

■機械学習3つの手法

　機械学習は大きく3つの手法に分類できる。

　教師あり学習、教師なし学習、強化学習である。

　教師あり学習はお手本を見せていく学習方法だ。りんごの写真を見せて、「これはりんごだよ」と教える。このとき、写真に対して添える言葉「りんご」をラベルと呼ぶ。何枚も何枚もりんごの写真を見せていき、「データがこうしたパターンのときは、りんごなんだ」と学ぶのである。

　教師なし学習はお手本なしで、大量のデータを見せていく学習方法である。お手本なしで学んでいくので、「これはりんごだ」「そっちはうどんだ」などとわかるわけではない。

　でも、データの中からパターンを抽出することはできる。データから上手にパターンを抽出できるようになったら、人間はそれを見て「おお、今まで気づかなかったこんな購買傾向があったのか」などと分析するのである。

　さっきのりんごとうどんの例で言えば、2つのパターンを見つけたとして「こっちのパターンはりんご」「こっちのパターンはうどん」と後から教えてあげることもできる。

　強化学習は、目的に対して試行錯誤させることで、目的を達成できるような行動を見つけていく手法である。ロボットに逆上がりを学習させたいとして、目的である逆上がりは示すが、どんなふうにすればいいかは教えない（違う言葉で表現すれば、やり方がわかっていなくても学習させられる）。

　ロボットは手当たり次第にやれる行動を取ってみる。愚にもつかない行動も取るだろうが、逆上がりに至るような惜しい行動も取るだろう（足を振り上げるとか）。目的に近づいたら加点を、遠ざかったら減点を行って試行錯誤を続行させることで、だんだん目的を達成するための望ましい行動を選択するようになっていくのである。

■手法を組み合わせる

　もちろん、どれが一番良くてどれがダメで、という関係ではない。それぞれの手法を組み合わせて望ましい結果を出していく。

　将棋の例を挙げると、名人の棋譜を喰わせることで教師あり学習を行うことができる。名人の指し手に近づくように自らを調整していくのだから、そりゃあ強くなる。

　ただし、限界もある。喰わせるデータが枯渇するのだ。将棋の棋譜は大昔から残っているが、100億だの100兆だのといった数があるわけではない。早晩、データはなくなる（なくなった）のである。

　また、名人の指し手を参考にするなら、名人を超えることはなかなか難しい。そこで強化学習を組み合わせる。たとえば、AI同士でばんばん対局を行う。ランダム性を取り入れるから、同じ指し手に集中することもない。有効な棋譜がどんどん貯まっていく。

　将棋の場合はゴールが明瞭で、「相手に勝つ」ことだから、試行錯誤の末のよくわからん手でも勝ったならば、あるいはその一手で局面が良くなったならば「この指し手はいい手だったのだ。この手を指す確率を上げよう」と自分の行動を「強化」する。これを1億回、1兆回と繰り返していけば、はかばかしく強くなる。

■ディープラーニングという切り札

　さらにディープラーニングという切り札も登場した。

　人間の脳を模倣したモデルで、人工ニューロンをつないだニューラルネットワークを作る。いくつかの入力に対して、条件に応じて出力を行う。これを組み合わせるとニューラルネットワークになる。

　入力→中間→出力のシンプルなニューラルネットワークを「3層」と表現するが、中間層のニューロンが増えて全体が4層以上になったものをディープニューラルネットワークと言い、それを使って学習を行うことをディープラーニングと言う。

　学習を進めることで、たとえばある中間層ではヒゲに反応し、ある中間層では尻尾に反応し、といったようにネットワークが育っていく。しかも、「どんな点に注目すればいいか」（将棋の例で言えばルール。より一般的には特徴量）を自分で見つけてくれるのだ。めちゃくちゃ楽である。

　おそらく人間の脳もこのように機能していると考えられているが、これが激烈に効いたのが画像認識と自然言語処理である。他の分野にも進歩をもたらしているが、今までの主要な成果はこの2分野に集中している。