マイクロソフトは「間違いから学ぶ」モデルトレーニング方法を発表し、「人間の学習プロセスを模倣し、AIの推論能力を向上させる」ことができると主張している。

マイクロソフトは「間違いから学ぶ」モデルトレーニング方法を発表し、「人間の学習プロセスを模倣し、AIの推論能力を向上させる」ことができると主張している。

IT Homeは11月7日、マイクロソフトリサーチアジアが北京大学、西安交通大学などの大学と共同で「Learning from Mistake(LeMA)」と呼ばれるAIトレーニング方法を提案し、人間の知識学習のプロセスを模倣することでAIの推論能力を向上させることができると主張していると報じた。

現在、OpenAI GPT-4 や Google aLM-2 などの大規模言語モデルは、自然言語処理 (NLP) タスクや思考連鎖 (CoT) 推論の数学的問題タスクで優れたパフォーマンスを発揮しています。

しかし、LLaMA-2やBaichuan-2などの大規模なオープンソースモデルは、関連する問題に対処するために強化される必要があります。これらの大規模なオープンソース言語モデルの思考連鎖推論能力を向上させるために、研究チームはLeMA法を提案しました。このアプローチは主に「間違いから学ぶ」ことで人間の学習プロセスを模倣し、モデルの推論能力を向上させます

▲画像出典:関連論文

IT Homeは、研究者の手法は「誤った回答」と「修正された正解」を含むデータのペアを使用して、関連するモデルを微調整することだったことを発見した。関連データを取得するために、研究者は 5 つの異なる大規模言語モデル (LLaMA および GPT シリーズを含む) の誤った回答と推論プロセスを収集し、GPT-4 を「修正子」として使用して修正された回答を提供しました。

修正後の正解には、元の推論プロセスにおける誤った部分、元の推論プロセスにおける誤りの理由、そして正しい答えを得るために元の方法をどのように修正するかという 3 種類の情報が含まれていることが報告されています。

研究者らは、GSM8KとMATHを使用して、5つの大規模なオープンソースモデルでLeMaトレーニング方法の有効性をテストしました。その結果、改良されたLLaMA-2-70Bを例にとると、GSM8Kでの精度は83.5%と81.4%、MATHでは25.0%と23.6%でした。

研究者らは現在、LeMA の関連情報を GitHub で公開しています。興味のある方は、こちらをクリックしてご覧ください。

<<:  AGI(汎用人工知能)は数年のうちに実現されるでしょうか? 3つのテクノロジー大手が判決を下す

>>: 

ブログ    

推薦する

産業用ロボットの急速な発展は社会にどのような影響を与えるのでしょうか?

インテリジェントインダストリー4.0の急速な発展に伴い、ますます多くの業界でロボットが手作業に代わる...

...

34B パラメータが GPT-4 を上回ります! 「数学的普遍モデル」MAmmoTH オープンソース: 平均精度が最大 29% 向上

数学的推論は言語モデルが避けることのできない問題点です。さまざまなブラックテクノロジーのサポートがあ...

フロントエンドの面接でよく聞かれるアルゴリズムに関する質問

ただし、フロントエンドでアルゴリズムに触れる機会はほとんどありません。ほとんどがインタラクティブな操...

日本の芥川賞受賞者が認める:小説の5%はChatGPTによって書かれた

1月22日、日本で最も権威のある文学賞である芥川賞を受賞した作家が、受賞作である小説「東京同情塔」の...

将来、ロボットがあなたの仕事を奪うでしょうか?慌てずに専門家の言うことに耳を傾けましょう

[[384941]]スペインの新聞「エル・エコノミスタ」は最近、ラモン・オリバー氏による「仕事の自動...

大型モデルがドローンを制御できるように、北京航空航天チームは具現化された知能の新しいアーキテクチャを提案した

マルチモーダル時代突入、大型機種でもドローンを操縦可能!視覚モジュールが開始条件を捉えれば、大型モデ...

...

画期的なニューラルネットワークが量子AI研究への道を開く可能性

海外メディアの報道によると、イタリアの研究者らは最近、量子コンピュータ上で特殊なアルゴリズムを実行す...

アルゴリズミア:人工知能は2021年に主流になる

1月6日、海外メディアの報道によると、新型コロナウイルス肺炎流行の影響により、企業内での人工知能技術...

AIは信頼の危機にどう対処するか

今後 10 年間で AI が改善する必要がある領域が 1 つあります。それは透明性です。しかし、人工...

5G、IoT、AI、機械学習は2021年に最も重要なテクノロジーとなる

[[353503]]画像ソース: https://pixabay.com/images/id-575...

人工知能と機械学習における13の共通概念

[[422893]] 01 人工知能アラン・チューリングは人工知能を次のように定義しました。カーテン...

ラブライブ!AI論文発表:生成モデルが楽譜を自動生成

有名アイドルプロジェクト「ラブライブ!」がAI論文を発表しました。そうです。最近、プレプリント論文プ...

全人代副代表の馬化騰氏は8つの書面提案を提出し、ブロックチェーンや人工知能など17の質問に答えた。

[[221404]] 3月3日午後9時30分、全国人民代表大会の代表でテンセント会長の馬化騰氏が黒...