IT Homeは11月7日、マイクロソフトリサーチアジアが北京大学、西安交通大学などの大学と共同で「Learning from Mistake(LeMA)」と呼ばれるAIトレーニング方法を提案し、人間の知識学習のプロセスを模倣することでAIの推論能力を向上させることができると主張していると報じた。 現在、OpenAI GPT-4 や Google aLM-2 などの大規模言語モデルは、自然言語処理 (NLP) タスクや思考連鎖 (CoT) 推論の数学的問題タスクで優れたパフォーマンスを発揮しています。 しかし、LLaMA-2やBaichuan-2などの大規模なオープンソースモデルは、関連する問題に対処するために強化される必要があります。これらの大規模なオープンソース言語モデルの思考連鎖推論能力を向上させるために、研究チームはLeMA法を提案しました。このアプローチは主に「間違いから学ぶ」ことで人間の学習プロセスを模倣し、モデルの推論能力を向上させます。 ▲画像出典:関連論文 IT Homeは、研究者の手法は「誤った回答」と「修正された正解」を含むデータのペアを使用して、関連するモデルを微調整することだったことを発見した。関連データを取得するために、研究者は 5 つの異なる大規模言語モデル (LLaMA および GPT シリーズを含む) の誤った回答と推論プロセスを収集し、GPT-4 を「修正子」として使用して修正された回答を提供しました。 修正後の正解には、元の推論プロセスにおける誤った部分、元の推論プロセスにおける誤りの理由、そして正しい答えを得るために元の方法をどのように修正するかという 3 種類の情報が含まれていることが報告されています。 研究者らは、GSM8KとMATHを使用して、5つの大規模なオープンソースモデルでLeMaトレーニング方法の有効性をテストしました。その結果、改良されたLLaMA-2-70Bを例にとると、GSM8Kでの精度は83.5%と81.4%、MATHでは25.0%と23.6%でした。 研究者らは現在、LeMA の関連情報を GitHub で公開しています。興味のある方は、こちらをクリックしてご覧ください。 |
<<: AGI(汎用人工知能)は数年のうちに実現されるでしょうか? 3つのテクノロジー大手が判決を下す
10月22日、海通国際証券のアナリストであるPu Deyu氏が最近、Appleが早ければ2024年末...
[[113040]]コンピューターがまだ十分に機能していない分野がいくつかあります。たとえば、顔認識...
評価基準の違いにより、統一基準に基づく既存の小規模学習法の公平な比較が大きく妨げられており、この分野...
[[410843]] 7月9日、2021年世界人工知能大会の期間中に開催された「新世代人工知能コンピ...
今日では、盗作された記事や作品が出版され、盗作者がそれを無料で使用したり、利益を得たりすることは珍し...
社会の発展と科学技術の進歩に伴い、人工知能技術が人類に与える影響は日々増大しており、その応用分野は拡...
最近、クライアントの開発チームと SQL Server データ マイニングとそのアプリケーションにつ...
インテリジェント音声アシスタントとチャットボットは、現在人工知能のホットスポットであり、画期的な進歩...
10年前は多くの人が必死に五線譜を練習していましたが、今ではほとんど誰も使っていません。 5年前は...
近年、3D コンピューター ビジョンと人工知能はともに急速に進歩していますが、両者の効果的な組み合わ...
複数のターゲットを追跡するには、次の 2 つの方法があります。オプション1初期化フレームの追跡に基づ...
小売業界の状況はかつてないほど変化しています。実店舗の小売業者はオンライン小売業との厳しい競争に直面...
北京大学チームの最新の研究結果: ランダムトークンは、大規模なモデルで幻覚を引き起こす可能性がありま...