GPT-4 の計算能力不足の問題をどうやって解決するか?小学生のように扱えば、結果は電卓と同じくらい正確であることが保証されます

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

大規模言語モデルの数学的能力を突破するにはどうすればよいでしょうか?

数学の学部生が次のことを発見しました。

実際、小学1年生のように「指で数える」ことを教えるだけで、彼らはすぐに数学のエキスパートになれます。

写真

たとえば、「34756918247632 + 7934619867453210082」のような大きな数の加算は、GPT-4 のような強力なモデルであっても、大規模なモデルでは解決できません。

しかし、彼の言う通りにすれば、電卓で数字を入力した場合とまったく同じ結果になることが保証されます。

具体的にはどうすればいいのでしょうか？

GPT-4を小学生のように教える

上記の加算問題を例に挙げてみましょう。GPT-4 が正しく解くためには、2 つの例を与える必要があります。

しかし、非常に単純なもので十分であり、重要なのは計算プロセスを詳細に説明することです。

最初の例は次のとおりです。

379+64 を計算するように教える必要があります。

具体的には、まず GPT-4 に 2 つの加数の桁数と各桁の数を整理させます。

次に、最初の加数が 2 番目の加数より 1 桁多い場合はゼロを追加するように指示します。

どこで補う？桁数の少ない加数を加算します。つまり、64 は 064 になります。

これが完了したら、最初の手順をもう一度繰り返します。

次に、繰り上がりやつながりなどを表す変数や初期値をいくつか設定し、上位の桁から1つずつ数字を加算していき、各桁の結果を結合すると、最終的な答えが得られます。

下のプロンプトワードテンプレートからわかるように、非常に詳細に書き、相手を小学生のように扱う必要があります。

(追記: 2 番目の数字 7+6+c を計算するときに著者がミスを犯したことがわかります。これは 14 に等しくなるはずで、間違った最終結果につながります。しかし、これはまったく影響しません。アイデアが正しければ、モデルはそれを実現できます!)

2 番目の例でも手順は同じです。主な違いは、今回は 0 を追加する必要がないことです。他の人を小学生として扱う場合は、それぞれの状況を明確に説明する必要があります。

上記の 2 つの例をテンプレートとして GPT-4 に入力したら、あとは多くの指示を与えるだけです。

これは追加演算を行うために使用する必要があるテンプレートであり、同じキーワードを使用する必要があります。
テンプレートに書かれているとおりに従うことを忘れないでください。スペースが必要な場所にはスペースが必要です。テンプレートでは大文字は使用されないので、大文字は使用しないでください。
計算の前後に説明や余分な言葉を追加しないでください。上記のテンプレートに従うことが唯一のタスクです。
最後に、回答をプレーンテキストとしてフォーマットします。

次にこう言います:

ここで、2 つの新しいオペランドを提供し、テンプレートを使用して答えを計算する必要があります。わかりますか？

（英語のプロンプトは次のとおりです：これは加算を行うために使用する必要があるテンプレートです。同じキーワードを使用する必要があります。上記のどこにでも空白を使用する必要があります。
大文字はテンプレートに存在しないため、使用しないでください。計算の前後に説明やつなぎの言葉を追加しないでください。あなたの唯一の仕事は、上記のテンプレートに従うことです。
回答をプレーンテキストとしてフォーマットします。
新しいオペランドのセットを提供するので、テンプレートを使用して答えを計算する必要があります。わかりましたか？

このとき、GPT-4 は次のように伝えます: 了解しました。提供されたテンプレートに厳密に従って、2 つの数値の加算を計算します。

次に、「34756918247632」と「7934619867453210082」と入力します。各数字の間には必ずスペースを入れてください(理由は後で説明します) 。