ハルビン工科大学と快手が共同でCogGPTを提案:大規模モデルにも認知反復が必要

ハルビン工科大学と快手が共同でCogGPTを提案:大規模モデルにも認知反復が必要

認知科学の分野では、人間が継続的な学習を通じて認知を変化させるプロセスを認知ダイナミクスと呼びます。比喩的に言えば、認知反復は私たちの脳の「ソフトウェア更新」プロセスのようなものです。モバイル アプリケーションは、バグを修正し、新しい機能を追加するために絶えず更新されます。私たちの脳は、常に新しい知識と経験を学習することで、思考方法を改善し、最適化します。

風邪に最も効く薬を判断する方法から、何世代にもわたる数学者がフェルマーの最終定理を証明してきた方法まで、認知の反復は個人の精神的発達と人類文明の進歩の両方において不可欠な役割を果たしてきました。

現在、GPT-4 などの大規模言語モデル (LLM) は人工汎用知能 (AGI) の開発に希望をもたらしていますが、同時に認知固定化という重大な問題も明らかにしています。例えば、「宇宙の中心はどこにあるか」という古典的な質問に対して、異なる時代の人々は、その時代の情報に基づいて異なる答えを出しますが、大規模モデルの場合、そのパラメータはトレーニング後に固定されます。この時点で、大規模モデルは、アップグレードできず、新しい情報を学習できなくなった古いソフトウェアのようなものです。

大規模モデルに特定の認知的背景を設定することで、文脈内学習を通じて対応する回答をシミュレートできますが、この認知的反復は自己駆動型ではなく、未知の情報環境に適応することはできません。ここで疑問が浮かび上がります。大規模なモデルが、人間と同じように、絶えず変化する情報に基づいて自己駆動型の認知反復を実現できるようにするにはどうすればよいでしょうか。

幸いなことに、この質問にはすでに予備的な答えがあります。ハルビン工業大学と快手科技の研究チームが、LLMの認知ダイナミクスの概念を初めて提案しました。それだけでなく、この概念を体系的にモデル化するために、彼らは正式なタスク定義と関連ベンチマーク CogBench を提供し、大規模言語モデルの認知反復を明示的にモデル化する LLM 駆動型エージェントである CogGPT を提案しました。つまり、この研究を基にすれば、将来の大規模言語モデルは単なる情報処理ツールではなく、人間の思考方法をさらにシミュレートし、生​​涯学習を実現できるようになるということです。


  • 論文リンク: https://arxiv.org/abs/2401.08438
  • プロジェクトのホームページ: https://github.com/KwaiKEG/CogGPT

論文からわかるように、このタスクは心理学の分野における縦断的研究を模倣し、大規模なモデルに対して継続的な「心理テスト」を実施します。具体的には、このタスクでは、まず動的な情報フローを介して継続的に変化する情報環境を確立し、次に大規模モデルの初期の性格を設定し、同じ認知アンケートに定期的に記入するように依頼して、これらのモデルが継続的に情報を受け取るにつれて、モデルの認知がどのように変化するかを観察しました。

研究チームはこの課題を踏まえ、情報の流れの種類に応じて、長い記事に基づくCogBench_aと短い動画に基づくCogBench_vに分けられるベンチマークCogBenchも提案した。同時に、モデルと人間の評価の一貫性と評価理由の合理性を測定するために、信憑性と合理性という2つの重要な評価指標を確立し、大規模言語モデルの認知反復分析法を充実させた。

既存の大規模モデルではリアルタイムのパラメータ更新が実現できないため、研究チームは反復的な認知メカニズムを備えた LLM 駆動型エージェントである CogGPT を設計しました。このメカニズムには、情報を抽出、保存、取得するためのメモリ保持システムと、自己認識の反復を自動化するための共同改良フレームワークが含まれます。

例えば、次の例では、CogGPTは手工芸が好きな人物を演じています。彼女は最初、タトゥーについてあまり知らなかったため、「タトゥーは美の追求である」という見解に対して中立スコア3点を維持していました。「タトゥーは体に害を及ぼす」や「自家製香水タトゥーステッカーのチュートリアル」などの一連の短いビデオを見た後、彼女はタトゥーは体に有害であり、美しさの唯一の基準であってはならないと考えるようになりました。彼女はこの見解に対する見方を中立スコア3点から不同意2点に変化させました。同時に、彼女は自家製タトゥーステッカーにも興味を持つようになり、人間のような認知反復能力を発揮しました。

研究チームはまた、CogGPT と CogBench 上のいくつかの共通ベースラインに関する広範な実験を実施しました。実験結果によると、CogBench_a と CogBench_v の 2 つのベンチマークにおいて、CogGPT は信頼性と合理性という 2 つのコア評価指標において既存の方法を大幅に上回っており、CogGPT が特定のペルソナの認知反復プロセスを効果的に模倣できることがさらに証明されています。

インテリジェントシステムが人間のように学習し続けることができれば、私たちの生活に革命的な変化がもたらされるでしょう。その頃には、パーソナルアシスタントがより効率的なカスタマイズされたサービスを提供できるようになり、インターネットサーフィンはもはや人間だけの楽しみではなくなるかもしれません。この研究はまだ初期段階ですが、すでに可能性に満ちた未来が明らかになっています。

注目すべきは、チームが最近、7B/13B 大規模言語モデルのエージェント関連の機能を改善した KwaiAgents システムをオープンソース化したことです。リリース以来、Github (https://github.com/KwaiKEG/KwaiAgents) で 800 以上のスターを獲得しています。

<<:  世界中のコードの品質が急激に低下、その原因は AI です。 1億5300万行のコードの詳細な分析レポートが公開されました

>>:  Metaの公式Promptエンジニアリングガイド:Llama 2はより効率的

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

3分レビュー:8月の自動運転業界の完全な概要

[[426135]]チップ不足と疫病の影響により、今年初めから自動運転産業の発展は減速を余儀なくされ...

...

Nature の調査: AI が「必需品」になったと考える科学者はわずか 4%

AI に関する論文数は劇的に増加していますが、本当に AI が「必須」であると考えている研究者はわ...

...

Amazon Translateについて

Amazon Translate は、高速、高品質、手頃な価格の言語翻訳を提供するニューラル機械翻訳...

サイバーセキュリティにおける AI に関する 3 つの誤解

フィクションでも映画でも、人工知能は何十年にもわたって魅力的なテーマであり続けています。フィリップ・...

...

先日の清明節にはドローンが頻繁に登場しました!

近年、飛行制御、ナビゲーション、センシングなどの技術の急速な発展に伴い、ドローン業界はますます大きく...

C#DES アルゴリズムの概念と特性の簡単な分析

C# DES アルゴリズムは開発のセキュリティ部分として、その概念といくつかの簡単な歴史的起源を理解...

人工知能を活用する準備はできていますか?

[[349302]]今日、職場での学習は課題に直面しています。高度な分析、人工知能、ロボットが職場...

Azure ML Service を使用して機械学習モデルを構築およびデプロイする

[[256196]] [51CTO.com クイック翻訳] このチュートリアルでは、Stackove...

オートメーション・エニウェア、世界初のウェブベースRPAプラットフォームを発表

RPA(ロボティック・プロセス・オートメーション)業界のリーダーであるオートメーション・エニウェアは...

4つの高性能なデータ型、Pythonコレクションはコードの最適化とタスクの簡素化に役立ちます

この記事では、機械学習エンジニアの George Seif が、Python のコレクション モジュ...

...