マイクロソフト、言語モデルの推論機能を向上させるXOT方式を発表

マイクロソフト、言語モデルの推論機能を向上させるXOT方式を発表

マイクロソフトは11月15日、Google DeepMindのAlphaZeroにヒントを得て、コンパクトなニューラルネットワークを使用してAIモデルの推論機能を強化する「Everything of Thought」(XOT)と呼ばれる手法を発表した。

Microsoft、ジョージア工科大学、華東師範大学は協力して、強化学習とモンテカルロ木探索 (MCTS) 機能を統合し、複雑な意思決定環境における問題解決の有効性をさらに向上させるアルゴリズムを開発しました。

IT ホーム 注記: Microsoft の研究チームは、XOT メソッドにより言語モデルを未知の問題に拡張でき、Game of 24、8-Puzzle、Pocket Cube の厳密なテストで明らかな改善が見られると述べました。結果は、XOT が他の方法よりも大幅に優れており、他の方法では解決できない問題も解決できることを示しています。ただし、XOT は 100% の信頼性を達成するわけではありません。

XOT フレームワークには、次の主要なステップが含まれます。

  • 事前トレーニング フェーズ: MCTS モジュールは、効果的なマインド サーチに関するドメイン知識を学習するために、特定のタスクで事前トレーニングされます。軽量なポリシーと価値ネットワークが検索をガイドします。アイデア検索: 推論中に、事前トレーニング済みの MCTS モジュールはポリシー/値ネットワークを使用して、LLM のアイデアの軌跡を効率的に探索および生成します。
  • 思考の修正: LLM は MCTS の思考を確認し、エラーを特定します。修正されたアイデアは、追加の MCTS シミュレーションを通じて生成されます。
  • LLM 推論: LLM 問題解決の最終プロンプトに対して修正されたアイデアを提供します。

IT Homeでは、論文[PDF]のアドレスをここに添付していますので、興味のあるユーザーは詳しく読むことができます。

<<: 

>>:  IBM、スタートアップを支援するために5億ドルのエンタープライズAIベンチャーファンドを設立

ブログ    

推薦する

将来、人工知能が仕事を奪うことになるのでしょうか?

「将来、AI が仕事を奪うようになるか?」と尋ねると、おそらく周囲の人々からさまざまな意見が返って...

プログラミング能力はGPT-4を超え、アルパカコード版「スーパーカップ」が登場、ザッカーバーグ氏も自らLlama3をネタバレ

アルパカファミリーの「最強のオープンソースコードモデル」が「スーパーカップ」を発売しました——今朝、...

...

深い思考:テイクアウトの背後にある人工知能アルゴリズムの秘密

知識の蓄積は規模の拡大をもたらし、規模の拡大は市場の集中につながります。産業が「組立ライン」の形で固...

北京大学の法律モデルChatLawがサーバー爆発:張三の裁判方法を教えます

大型モデルが再び「爆発」した。昨夜、法律モデルChatLawがZhihuのホット検索リストのトップに...

...

視覚慣性走行距離計のIMU事前統合モデルについてお話しましょう

エンジニアリングの実践では、単に視覚オドメトリ (VO) を使用するのではなく、視覚と IMU を組...

...

企業におけるAIの応用は成熟段階に入ったのでしょうか?

マッキンゼーは、AI が多くの業務活動を自動化するという見通しに楽観的である一方で、あらゆる規模の自...

海外メディアがFacebookのコンテンツクリーンアップ作業を暴露:AIでも完了できない作業

AI は見たものからしか学習できません。シュローファー氏と150人以上のエンジニアリング専門家からな...

AIがグローバルビジネスのデータセンター管理を推進

現在、革命的な変化の波が進行しており、企業が顧客や企業にサービスを提供する方法を変えていると考えられ...

...

AutoGPTオープンソースAIエージェントを理解する

こんにちは、ルガです。今日も引き続き、人工知能 (AI) エコシステムに関連するテクノロジーである ...

2024年に注目すべき5つの持続可能な技術

今年が進むにつれて、持続可能な開発をめぐる話題はますます高まるばかりであり、気候変動が近づいていると...

...