ハルビン工科大学と快手が共同でCogGPTを提案:大規模モデルにも認知反復が必要

ハルビン工科大学と快手が共同でCogGPTを提案:大規模モデルにも認知反復が必要

認知科学の分野では、人間が継続的な学習を通じて認知を変化させるプロセスを認知ダイナミクスと呼びます。比喩的に言えば、認知反復は私たちの脳の「ソフトウェア更新」プロセスのようなものです。モバイル アプリケーションは、バグを修正し、新しい機能を追加するために絶えず更新されます。私たちの脳は、常に新しい知識と経験を学習することで、思考方法を改善し、最適化します。

風邪に最も効く薬を判断する方法から、何世代にもわたる数学者がフェルマーの最終定理を証明してきた方法まで、認知の反復は個人の精神的発達と人類文明の進歩の両方において不可欠な役割を果たしてきました。

現在、GPT-4 などの大規模言語モデル (LLM) は人工汎用知能 (AGI) の開発に希望をもたらしていますが、同時に認知固定化という重大な問題も明らかにしています。例えば、「宇宙の中心はどこにあるか」という古典的な質問に対して、異なる時代の人々は、その時代の情報に基づいて異なる答えを出しますが、大規模モデルの場合、そのパラメータはトレーニング後に固定されます。この時点で、大規模モデルは、アップグレードできず、新しい情報を学習できなくなった古いソフトウェアのようなものです。

大規模モデルに特定の認知的背景を設定することで、文脈内学習を通じて対応する回答をシミュレートできますが、この認知的反復は自己駆動型ではなく、未知の情報環境に適応することはできません。ここで疑問が浮かび上がります。大規模なモデルが、人間と同じように、絶えず変化する情報に基づいて自己駆動型の認知反復を実現できるようにするにはどうすればよいでしょうか。

幸いなことに、この質問にはすでに予備的な答えがあります。ハルビン工業大学と快手科技の研究チームが、LLMの認知ダイナミクスの概念を初めて提案しました。それだけでなく、この概念を体系的にモデル化するために、彼らは正式なタスク定義と関連ベンチマーク CogBench を提供し、大規模言語モデルの認知反復を明示的にモデル化する LLM 駆動型エージェントである CogGPT を提案しました。つまり、この研究を基にすれば、将来の大規模言語モデルは単なる情報処理ツールではなく、人間の思考方法をさらにシミュレートし、生​​涯学習を実現できるようになるということです。


  • 論文リンク: https://arxiv.org/abs/2401.08438
  • プロジェクトのホームページ: https://github.com/KwaiKEG/CogGPT

論文からわかるように、このタスクは心理学の分野における縦断的研究を模倣し、大規模なモデルに対して継続的な「心理テスト」を実施します。具体的には、このタスクでは、まず動的な情報フローを介して継続的に変化する情報環境を確立し、次に大規模モデルの初期の性格を設定し、同じ認知アンケートに定期的に記入するように依頼して、これらのモデルが継続的に情報を受け取るにつれて、モデルの認知がどのように変化するかを観察しました。

研究チームはこの課題を踏まえ、情報の流れの種類に応じて、長い記事に基づくCogBench_aと短い動画に基づくCogBench_vに分けられるベンチマークCogBenchも提案した。同時に、モデルと人間の評価の一貫性と評価理由の合理性を測定するために、信憑性と合理性という2つの重要な評価指標を確立し、大規模言語モデルの認知反復分析法を充実させた。

既存の大規模モデルではリアルタイムのパラメータ更新が実現できないため、研究チームは反復的な認知メカニズムを備えた LLM 駆動型エージェントである CogGPT を設計しました。このメカニズムには、情報を抽出、保存、取得するためのメモリ保持システムと、自己認識の反復を自動化するための共同改良フレームワークが含まれます。

例えば、次の例では、CogGPTは手工芸が好きな人物を演じています。彼女は最初、タトゥーについてあまり知らなかったため、「タトゥーは美の追求である」という見解に対して中立スコア3点を維持していました。「タトゥーは体に害を及ぼす」や「自家製香水タトゥーステッカーのチュートリアル」などの一連の短いビデオを見た後、彼女はタトゥーは体に有害であり、美しさの唯一の基準であってはならないと考えるようになりました。彼女はこの見解に対する見方を中立スコア3点から不同意2点に変化させました。同時に、彼女は自家製タトゥーステッカーにも興味を持つようになり、人間のような認知反復能力を発揮しました。

研究チームはまた、CogGPT と CogBench 上のいくつかの共通ベースラインに関する広範な実験を実施しました。実験結果によると、CogBench_a と CogBench_v の 2 つのベンチマークにおいて、CogGPT は信頼性と合理性という 2 つのコア評価指標において既存の方法を大幅に上回っており、CogGPT が特定のペルソナの認知反復プロセスを効果的に模倣できることがさらに証明されています。

インテリジェントシステムが人間のように学習し続けることができれば、私たちの生活に革命的な変化がもたらされるでしょう。その頃には、パーソナルアシスタントがより効率的なカスタマイズされたサービスを提供できるようになり、インターネットサーフィンはもはや人間だけの楽しみではなくなるかもしれません。この研究はまだ初期段階ですが、すでに可能性に満ちた未来が明らかになっています。

注目すべきは、チームが最近、7B/13B 大規模言語モデルのエージェント関連の機能を改善した KwaiAgents システムをオープンソース化したことです。リリース以来、Github (https://github.com/KwaiKEG/KwaiAgents) で 800 以上のスターを獲得しています。

<<:  世界中のコードの品質が急激に低下、その原因は AI です。 1億5300万行のコードの詳細な分析レポートが公開されました

>>:  Metaの公式Promptエンジニアリングガイド:Llama 2はより効率的

ブログ    
ブログ    

推薦する

GitHubのレポートによると、米国のプログラマーの92%がAIツールを使用している

オンラインコードホスティングプラットフォームのGitHubは最近、従業員1,000人以上の米国企業を...

ベクトル監視なしのベクトル画像生成アルゴリズムがCVPR 2021に選出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

タオバオの顔面を平手打ちして電子商取引を破壊しよう!このファッション会社はアルゴリズムを使って新しい小売業をリードしている

[51CTO.com からのオリジナル記事] 私が共有したトピックは、データ駆動型の意思決定サポート...

AI生成画像に追加されたデジタル透かしは簡単に解読できると研究で判明

10月6日、EngadgetやWiredなどの海外メディアの報道によると、メリーランド大学の研究チー...

GNN の推奨システムとアプリケーション

1. GNN推奨システムの基礎となる計算能力の進化過去 20 年間にわたり、コンピューティングは進化...

AIエージェントは動物の進化の法則を学ぶ: Fei-Fei Liらが深層進化RLを提案

インテリジェントエージェントは人工知能分野の主要な研究テーマであり、非身体型知能と身体型知能に分けら...

...

人間は AI シミュレーションの中で生きられるのか?

人々が自らに問うべき実存的な問いは、自分たちがシミュレートされた宇宙に住んでいるかどうかだ。 [[3...

ビッグデータを使用してSalesforce Einstein分析の価値を理解する

ビッグデータを活用する方法を学ぶには、新しく開発されたソフトウェアである Salesforce Ei...

GitHubオープンソース130+スター:PPYOLOシリーズをベースにターゲット検出アルゴリズムを再現する方法をHand in handで教える

物体検出は、コンピューター ビジョンの分野における基本的なタスクです。適切な Model Zoo な...

...

Python 密度クラスタリング アルゴリズム - DBSCAN の実践

この記事の主な内容:序文DBSCAN クラスタリング アルゴリズムパラメータ選択DBSCANアルゴリ...

「説明可能な」AIが金融セクターへの信頼を高める

[[423755]]人工知能は、詐欺の特定や金融犯罪の撲滅から、顧客への革新的なデジタル体験の提供に...

いくつかの一般的な暗号化アルゴリズムのPython実装

私たちは日常生活の中で、暗号化アルゴリズムによく遭遇します。今日は、これらの暗号化アルゴリズムの P...