Chain of Thought(CoT、思考の連鎖)推論とは、AI(特に大規模言語モデル)に問題を解かせる際、「いきなり答えを出させるのではなく、人間が頭の中で考えるように、途中の思考プロセスや計算のステップを順を追って出力させる技術」のことです。
2022年頃にGoogleの研究者らによって提案され、現在の高性能なAI(ChatGPTの「o1」シリーズや、このGeminiの裏側など)が複雑な問題を解くための基盤となっています。
なぜこれが重要なのか、具体的な仕組みと効果を分かりやすく解説しますね。
1. 従来の方式(Direct Prompting)との違い
例えば、ちょっとしたひっかけのある算数の文章題を解かせるとします。
問題:
「お店にリンゴが10個ありました。3個売れました。その後、新しく5個仕入れましたが、そのうち2個は傷んでいたので捨てました。今、お店に使えるリンゴは何個ありますか?」
従来の方式(いきなり答えを出す)
AIの出力: 12個(あるいは勘違いして間違った数)
問題点: 人間でも暗算でパッと答えると間違えることがあるように、AIも一発で答えを出そうとすると、途中の計算をすっ飛ばして間違った確率の高い言葉を生成してしまいがちです。
Chain of Thought(思考の連鎖)
AIの出力:
最初にリンゴは10個ありました。
3個売れたので、残り個数は $10 - 3 = 7$ 個になります。
その後、5個仕入れたので、一時的に $7 + 5 = 12$ 個になります。
しかし、そのうち2個は傷んでいて捨てたので、最終的な個数は $12 - 2 = 10$ 個です。
答: 10個
このように、「AだからB、BだからC、よって答えはD」という論理のステップを自分で書き出しながら進めるのが、Chain of Thought推論です。
2. なぜCoTでAIの賢さが劇的に上がるのか?
言語モデル(LLM)は本来、「前の単語に続く、最も確率の高い次の単語」を予測する仕組みで動いています。複雑な計算や論理パズルを前にしたとき、1単語目にいきなり「正解の数字」を予測するのは非常に困難です。
しかし、CoTを使うと以下のようなメリットが生まれます。
問題を小さく分解できる: 複雑な大問題を、1ステップずつの簡単な小問題(引き算、足引き、条件の整理)に分解して処理できます。
「考える時間(計算量)」を確保できる: 途中の文章をたくさん出力(出力トークンを消費)すること自体が、コンピューターでいう「メモリや処理時間を多く使ってじっくり考えている状態」を生み出します。
間違いに気づきやすくなる: 前のステップの出力結果を自分で見ながら次のステップを計算するため、論理の破綻が起きにくくなります。
3. CoTを動かす2つのアプローチ
この推論をさせるには、大きく分けて2つの方法があります。
① Few-Shot CoT(例題で覚えさせる)
プロンプト(指示文)の中で、人間が「問い」と「途中の考え方+答え」のセットをあらかじめ1〜2個見せてあげる方法です。AIはそれを見て「あ、こういう風に順を追って考えればいいんだな」と真似をします。
② Zero-Shot CoT(魔法の言葉)
例題を見せなくても、プロンプトの最後に「ステップバイステップで順を追って考えてください(Let's think step by step)」と1行書き加えるだけで、AIは自動的に思考プロセスを組み立ててから答えを出すようになります。
まとめ
Chain of Thought推論を一言で言えば、「AIに『落ち着いて、順番に紙に書き出しながら解きなさい』と促す技術」です。
最近の「考えるAI」は、ユーザーが特に意識して指示しなくても、内部(裏側)でこのCoTを高速かつ深く実行し、十分に考えがまとまった状態の綺麗な回答だけを画面に出力してくれるようになっています。
0 件のコメント:
コメントを投稿