馬懿、沈向陽、曹英の最新AIレビューが人気に！作成に3か月かかりました。ネットユーザー必読の論文です

この記事はAI新メディアQuantum Bit（公開アカウントID：QbitAI）より許可を得て転載しています。転載の際は出典元にご連絡ください。

長い間待ち望まれていましたが、ついに馬易教授のAIレビュー論文が発表されました！

このプロジェクトは神経科学者の曹英氏とコンピューター科学者の沈向陽氏との共同作業で完成し、完成までに3か月以上を要した。

彼はこの論文を「過去 5 年間の研究と 70 年間の知能の発展を組み合わせたもの」と表現し、次のようにも述べています。

人生でこれほど多くのエネルギーと時間を記事に費やしたことはありません。

具体的には、「知能の起源と計算原理の基本的な概要と枠組みを整理し、理論と実践を結びつける可能性を誰もが認識できるようにした」という。

予告編がソーシャルネットワーク上で公開されると、多くのネットユーザーが期待を寄せた。

その結果、今日それを公開した直後に、ある学者が新しい生成モデルを設計していると言って、それが私にインスピレーションを与えました。

これは何の紙か見てみましょうか？

2つの主要な原則：シンプルさと一貫性

過去 10 年間、人工知能の進歩は主に均質なブラックボックスモデルのトレーニングに依存しており、意思決定プロセスや特徴表現などの側面を説明することはほとんど困難です。

このエンドツーエンドの大まかなトレーニングは、モデルのサイズ、トレーニングデータ、コンピューティングコストの継続的な増加につながるだけでなく、実際には多くの問題も伴います。

学習した表現は豊かさに欠け、トレーニング中の安定性に欠け、適応性に欠け、壊滅的な忘却に陥りやすい…

このような背景に基づいて、研究者は、実際のところこれらの問題の根本的な原因の 1 つは、インテリジェントシステムの機能と組織原理に関する体系的かつ包括的な理解が欠如していることであると仮説を立てています。

これを説明する統一された方法はありますか?

この目的のために、この記事では、学習に関する 2 つの基本的な質問に答える、単純さと自己一貫性という 2 つの基本原則を提案します。

1. 何を学ぶか: データから学ぶことの目標は何ですか、そしてそれをどのように測定しますか?

2. 学習方法: 効率的かつ効果的なコンピューティングを通じて、このような目標を達成するにはどうすればよいでしょうか?

彼らは、これら 2 つの原則があらゆるインテリジェントシステムの機能と設計を制約し、測定可能かつ計算可能な方法で言い換えることができると考えています。

たとえば、シンプルさを考えてみましょう。知能の基礎は環境内の低次元構造であり、これによって予測と一般化が可能になり、それが簡素化の原理となります。しかし、どのように測定すればよいのでしょうか?この論文では、単純さを測定するための幾何学的公式を提案します。

これら 2 つの原則に基づいて、コンプレッサーとジェネレーター間の閉ループ転写という、知覚/インテリジェンスの一般的なアーキテクチャが導き出されます。

これは、2 つの間のやり取りが追跡と逃走のゲームになるはずだということを示唆しています。このゲームでは、オートエンコーダの代わりに、共同目的関数の反対側をプレイします。

これはこのフレームワークの主な利点の 1 つでもあり、自己監視と自己批判による自己学習が最も自然で効果的です。

基本的に、このフレームワークは、各新しいサンプルとその増分が単純に新しい累積として扱われる、完全に教師なしの設定に拡張できます。

自己監督型+自己批判ゲームメカニズム、このような閉ループ転写は簡単に学習できます。

この学習された特徴の構造は、霊長類の脳で観察されるカテゴリー選択領域の構造に似ていることは注目に値します。

著者の一人であるCao Ying氏は、このフレームワークは予測コーディング、対照学習、生成モデル、Transformerなど、これまでの多くのアイデアに似ていると述べています。

さらに、CVとグラフィックスの閉ループ関係など、いくつかの新しい方向性も提案されました。

最後に、これらすべてをまとめると、タスクに最適な戦略を学習する自律型インテリジェントエージェントは、認識(フィードバック) 、学習、最適化、アクションを閉ループに統合します。

現代のディープネットワークと多くの AI 実践の進化を統合して説明します。記事全体では、主に視覚データのモデリングを例として使用します。

しかし研究者たちは、これら2つの原理が広範囲にわたる自律的知能システムに対する理解を統一し、脳を理解するための枠組みを提供すると信じている。

最後に、熱力学の父の言葉で終わります。

一般的な考え方は、自分が話していることを測定して数値で表現できる場合にのみ、それを理解しているということです。そうでなければ、それは知識の始まりかもしれませんが、思考においては科学の段階にはほとんど進んでいません。

もう一つ

興味深いことに、arXivに投稿する際に、Ma Yi教授はオンラインでも助けを求めました。

誰かがインターフェースを書くことはできないのでしょうか?ワンクリックで論文を提出できるタイプです。論文の修正に多くの時間を費やす代わりに。

ネットユーザーからは、PdfLaTeX の代わりに LaTeX コンパイラを使用するようにというアドバイスも寄せられました。

中には写真を直接投稿する人もいました。

興味のある方は、下のリンクをクリックして詳細をご覧ください。

論文リンク:

https://arxiv.org/abs/2207.04630

<<: Colossal-AIはHugging Faceコミュニティをシームレスにサポートし、低コストで大規模モデルを簡単に加速します。

>>: 1 つの GPU + 数行のコードで、大規模モデルのトレーニング速度が 40% 向上します。 HuggingFaceのシームレスなサポート

馬懿、沈向陽、曹英の最新AIレビューが人気に！作成に3か月かかりました。ネットユーザー必読の論文です

2つの主要な原則：シンプルさと一貫性

もう一つ

掃除ロボットに抜け穴がある！あるいは数秒で盗聴ツールに変わる可能性もある

Zigbeeプロトコルスタックの暗号化アルゴリズムについての簡単な説明

Tech Neo 3月号「人工知能とモバイル」が発売されました

人工知能が人間の神経を刺激し、2017年は世界的な技術革新が活発化

大学入試特集：AI出願ガイド

人工知能

AIが新たな成長エンジンに。アマゾンウェブサービスの技術的手法に耳を傾けてみよう

教師なしニューラル機械翻訳: 単一言語コーパスのみを使用する

ハイエンドチップはインテリジェント運転の問題を解決できるでしょうか?

推薦する

MetaがAI画像編集ツールEmu Editを発表 / ビデオ：1000万のデータセットでトレーニングされ、競合他社よりもはるかに優れていると主張

マスク氏がxAIの目標を設定：汎用人工知能の実現期限は2029年

清華大学の劉志遠氏：「ビッグモデルに関する10の質問」、新しいパラダイムの下での研究の方向性を見つける

AgentGPT: ブラウザ上の自律型 AI エージェント

日本俳優連合がAI法案を提案、「声の肖像権」創設求める

コミック版：ディープラーニングって何？

AIは感情に関してより賢くなってきているのでしょうか?人間もそうすべきだ

従来のGANを解釈可能に修正し、畳み込みカーネルの解釈可能性と生成された画像の真正性が保証される

マシンビジョンについて知っておくべきこと

国防総省は、今後数日間の出来事を予測するために人工知能を活用している。

「理解する」シナリオ + 「理解する」テクノロジー: スマート交通で旅行が予測可能になる

将来、人工知能に置き換えられない仕事が最も収益性が高くなるでしょう。それがどれか見てみましょう。

自然言語処理の核心：シーケンス学習