一時停止トークンを使用して大規模モデルを再トレーニングすると、AIは行動する前によく考えることを学ぶ

ChatGPT に回答を出す前に手順について考えてもらうことで、精度を向上させることができます。

では、プロンプトワードを省略して、この能力を大きなモデルに直接取り入れることは可能でしょうか?

CMU と Google チームによる新しい研究では、大規模なモデルをトレーニングするときに一時停止トークンを追加することでこれを実現します。

実験では、8つの評価項目の結果が改善され、そのうちSQuADのEMスコアは18％増加し、CommonSenseQAは8％増加し、GSM8kの推論タスクも1％増加しました。

研究者のジャック・ハック氏は、少し前にも同様の仮説を提唱しており、それが検証されたことを非常に嬉しく思っていると語った。

Nvidia のエンジニア、アーロン・エリクソン氏は、それは人間と話すときに「えー」や「あのー」を付け加えるのと同じではないか、と述べました。

事前トレーニングと微調整の両方で一時停止トークンが追加されます

この研究全体は、単純なアイデアに基づいています。

一連の (一時停止トークン) を入力シーケンスに追加し、モデルが次のトークンを出力するのを遅らせます。

これにより、より複雑な入力を処理するための追加の計算時間がモデルに与えられます。

著者は、下流のタスクを微調整するときにこれを導入するだけでなく、事前トレーニング中にシーケンスにランダムに挿入して、モデルが両方の段階でこの計算遅延を活用する方法を学習できるようにしています。

事前トレーニング段階では、標準的な自己回帰事前トレーニングのために、一定の割合の一時停止トークンがコーパスからの入力シーケンスにランダムに挿入されます。ただし、損失を計算する際には、一時停止トークンの予測はスキップされます。

下流タスクを微調整する際には、一定数の一時停止トークンも入力に追加され、モデルパラメータを微調整しながらターゲットシーケンスに対して自己回帰予測が実行されます。

推論フェーズでも同じ数の一時停止トークンが追加されますが、最後の一時停止トークンまでモデル出力を無視し、その後回答の抽出を開始します。

実験では、130M パラメータと 1B パラメータの2 つのバージョンに分かれた標準の Transformer 純粋デコーダーモデルを使用しました。

一時停止トークンは、独自の埋め込みサイズである 1024 個のパラメータのみを追加します。

9 つの異なるタスクでの実験では、微調整段階でのみ一時停止トークンを導入する効果は明らかではなく、一部のタスクは改善されないことが示されました。

ただし、事前トレーニングと微調整の両方で一時停止トークンを使用すると、ほとんどのタスクで大幅な改善が達成されます。

この論文では、一時停止トークンの数や場所などの重要なハイパーパラメータについても検討しています。通常、さまざまなモデルに最適な数があることがわかります。

最後に、著者はこの研究にも多くの限界があることを指摘した。

トークンを一時停止するとモデル計算量が増加するため、他の方法と比較することが公平であるかどうかはまだ議論の余地があります。
この新しい方法は、再度の事前トレーニングが必要であり、実際の適用には一定の困難がある。
具体的な動作メカニズムについてはまだ深く理解されていない。
推論中に一時停止トークンの数が0の場合、モデルのパフォーマンスは依然として低い。

検索エンジン You.com の CEO は、次は人間の認知能力を向上させるためのあらゆる技術を大規模モデルで試すべきか、と語りました。

今は「一歩ずつ考える」と「深呼吸する」です。

おそらく次のヒット論文は、大きなモデルに問題を抱えたまま眠ることを教えたり、あるいはもっととんでもないことに、健康的な食事と運動を教えたりするものになるだろう。

論文アドレス: https://arxiv.org/abs/2310.02226

<<: Googleは大規模モデルをより「インテリジェント」にし、GPT-4タスクの精度が大幅に向上しました。

>>: AIビデオ生成が新たな高みに到達：高解像度の映画品質、無料で無制限に再生可能、「史上最強」として知られる

ブログ

顔認識は数十億ドル規模のブルーオーシャンだが、まだ解決すべき問題が2つある

ブログ

Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

ブログ

脳コンピューターインターフェース技術における大きな進歩！麻痺した男性が初めて運動と触覚を取り戻す

ブログ

マイクロソフトリサーチアジアとOOCLが協力し、人工知能によるデジタル変革を推進

ブログ

デュアルポインタとスライディングウィンドウアルゴリズムテンプレート

ブログ

Facebook、動画から学習する新たなAIプロジェクトを開始

ブログ

Kubernetes にディープラーニングモデルをデプロイする方法

ブログ

5Gについて知っておくべきことは何ですか?

ブログ

一時停止トークンを使用して大規模モデルを再トレーニングすると、AIは行動する前によく考えることを学ぶ

事前トレーニングと微調整の両方で一時停止トークンが追加されます

顔認識は数十億ドル規模のブルーオーシャンだが、まだ解決すべき問題が2つある

Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

脳コンピューターインターフェース技術における大きな進歩！麻痺した男性が初めて運動と触覚を取り戻す

マイクロソフトリサーチアジアとOOCLが協力し、人工知能によるデジタル変革を推進

デュアルポインタとスライディングウィンドウアルゴリズムテンプレート

Facebook、動画から学習する新たなAIプロジェクトを開始

Kubernetes にディープラーニングモデルをデプロイする方法

5Gについて知っておくべきことは何ですか?

推薦する

ChatGPT が 1 周年を迎えました: 革新、論争、AI のブレークスルーの 1 年

ナレッジグラフは、機械が世界を理解するための基礎です。この 3 人の専門家がナレッジグラフテクノロジーをどのように使用しているかをご覧ください。

AIの使用後、機械は人間の皮膚に匹敵する触覚を持つ丨科学サブジャーナル

1 つの記事で UAV 通信リンクシステムを理解する

スパムボットが誤って7億件のメールアドレスとパスワードを漏洩

マイクロソフトの人工知能音声技術は「複数の感情レベル」の調整をサポートし、「人間の声」の繊細な解釈を可能にする

AIチャットボットとメンタルヘルス

携帯電話のネットワークアクセスに顔認識が必要ですか?顔認識は私たちの生活にどれくらい近いのでしょうか?

MotionLM: 言語モデルとしてのマルチエージェント動作予測

すべてを支配する 1 つのアルゴリズム! DeepMind はニューラルアルゴリズム推論を提案しています。ディープラーニングと従来のアルゴリズムの融合により、再び奇跡が起こるでしょうか?

Redditのランキングアルゴリズムの仕組み

Upscayl、最先端のAI画像拡大技術

一人称視点でガンダムを運転する？！コックピットに直接座り、VRを操作して材料を掴む。掘削機よりも柔軟。