超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

史上最強の集団が力を合わせてAI開発に挑む?

最近、北京大学の公式Weiboアカウントは、北京大学と清華大学が共同で一般人工知能実験クラスを開始すると発表した。

チームリーダーは、昨年中国に帰国したAIビジョンの第一人者、朱松春教授に他ならない。朱教授は現在、北京大学人工知能研究所の所長兼主任教授であり、清華大学の基礎科学科の主任教授も務めている。

[[395930]]

報道によると、北京大学総合人工知能実験クラスに入学した第一陣の学生26人は北京大学元培学院の出身で、今年の春学期に授業が始まった。清華大学の総合人工知能実験クラスはオートメーション学部にあり、すでに第一陣の入学受付を開始しており、入学予定者は30人だという。

北京大学と清華大学、最強同盟からどんなAIの火花が生まれるのか?

清華大学と北京大学を「競っている」朱松春は、コンピュータービジョンの最高賞を3回受賞した。

4月25日、北京大学の郝平学長は清華大学110周年記念式典でのスピーチの中で、両大学が最近協力して朱松春教授が率いる汎用人工知能実験クラスを設立したと述べた。

北京大学一般クラスは元北学院にあり、今年の春学期から授業が始まりました。清華大学一般クラスはオートメーション学部にあり、現在学生の募集を開始しています。

[[395931]]

誰もがこれに自信満々だ。北京大学と清華大学の金字塔に加え、チームリーダーの朱松春が最強の保証人だ。では朱松春とは誰なのか?

[[395932]]

朱松春は、1996 年にハーバード大学でコンピューター サイエンスの博士号を取得しました。国際的な数学の巨匠である David Mumford 教授の下で学びました。国際的なトップ ジャーナルや会議で 300 本以上の論文を発表し、コンピューター ビジョンの分野で最高の国際賞である Marr Prize を 3 回受賞しています。

彼はコンピュータービジョンに関して独自の見解を持ち、視覚的常識推論やシーン理解などの認知科学の分野で重要な貢献をしてきました。

昨年中国に帰国した際、私は白熱した議論を巻き起こし、国内で温かい歓迎を受けました。

朱松春自身は、「国家が歴史を忘れれば、その未来を失う運命にある」という一文を信じている。

この文章はコンピュータービジョンについても考えさせられるものです。

[[395933]]

彼は、視覚に関する新しく発表された多くの論文の中で、5年前の文献を引用しているものはほとんどないと述べました。その代わりに、過去2年間のarxivの記事を引用し、いくつかのベンチマークと比較しています。

10 年、20 年、あるいは 30 年前の論文を真剣に読む人はほとんどいませんが、当時のアイデアやフレームワークの一部は、現在の研究にとって依然として大きな意味を持ち、ほとんどすべての人が小数点よりも高い精度を得るために同じ方法を使用しています。

誰もが非常に近視眼的で、過去数年間の歴史と人気の方法だけに焦点を当てており、この分野を継承することができません。特に、現在の手法の波が衰退した後、このグループの人々は徐々に基盤と創造性を失っていくでしょう。

彼は自身の学歴について語り、デイビッド・マーが自分に最も大きな影響を与えたと信じている。

1960 年代の初めには、すでに多くの人が視覚神経生理学と心理学を研究しており、エッジ検出に関する研究を行っている人もいました。しかし、コンピュータービジョンはどのような問題を解決するのでしょうか?どうやってそれを達成するのでしょうか?皆の意見は分かれ、明確な結論に達することができませんでした。

David Marr は問題を計算 (実際には表現と言うべきでしょう)、アルゴリズム、実装という 3 つのレベルに分割しました。

まず表現レベルで、数学の問題としてどのように書くか。ミッションは何ですか?出力は何ですか?これは問題を解決するためのアプローチとは無関係です。

第二に、この数学の問題を解くときに、並列または直列でさまざまなアルゴリズムを選択できます。

繰り返しになりますが、アルゴリズムをハードウェアに実装する方法は、CPU、DSP、またはニューラル ネットワークを使用して実装できます。

さらに、David Marr 氏は、ビジョンが何を計算するのかについても明確にしました。

マールは、原始的なスケッチから 2 1/2D スケッチ、3D スケッチまで、一連の表現を提案しました。

これには、テクスチャ、ステレオビジョン、モーション分析、表面形状なども含まれます。 Marr 氏は、ビジュアル コンピューティングは単にソリューションを見つけることではなく、継続的なコンピューティング プロセスであると考えています。よく見て考えれば考えるほど、理解が深まる可能性があります。

マーが 1978 年の冬に急性白血病と診断されたことは特筆に値します。余命が長くないことを知ったマーは、急いで「視覚: 人間の視覚情報の表現と処理に関する計算的観点」という本をまとめました。彼は 35 歳で亡くなりました。

Zhu Songchun 氏と彼の同僚はこの本の作成に 8 年を費やし、テクスチャ、画像プリミティブ、プリミティブなシンプル画像など、Marr 氏の初期の視覚概念を統一された数学モデルに変換しました。

それ以来、視覚は純粋に理論的かつ計算的な観点から研究されるようになりました。

朱松春氏は、視覚の統計モデル化と計算理論に加えて、パターン認識の創始者である傅景孫氏の構文パターン認識理論を拡張し、画像やシーンを解析するための計算フレームワークも実装しました。

2010年以来、チュー氏はコンピュータービジョンを認知科学、自然言語理解、ロボット工学などの分野と組み合わせ、感覚入力では観察できない知能の95%、いわゆる「人工知能のダークマター」を研究してきた。

現在、Zhu Songchun 氏のチームは、日常のさまざまなタスクの実行を担う自律型 AI エージェントのトレーニングとテストを行うための大規模で物理的にリアルな VR/AR 環境を構築しました。

これらのエージェントは、視覚、言語、認知、機械学習、ロボット工学などの分野の機能を統合し、その過程で身体的および社会的常識を開発し、認知アーキテクチャを使用して人間とコミュニケーションをとることができます。

朱松春教授を知る人々は、彼の厳格な学問精神を賞賛することを躊躇しません。

なぜ汎用人工知能の人材を育成する必要があるのでしょうか?

「人工知能は1956年に始まった新興分野です。当時の目標は汎用人工知能でした。人々は、仮想キャラクターや物理的なロボットなど、さまざまなインテリジェントエージェント(AIエージェント)の研究を望んでいます。このインテリジェントエージェントには、自律的な知覚、認識、意思決定、学習、実行、社会的コラボレーションの能力が必要です。また、人間の感情、倫理、道徳観念にも適合する必要があります。これが汎用人工知能です。」と朱松春氏は紹介した。

朱松春氏はかつて、人工知能システムは3つの要素によって決定されることが多いと述べました。1つ目はアーキテクチャ、つまり知能、2つ目は環境データ、3つ目はタスクです。

[[395934]]

これには 3 つのレベルのソリューションが含まれます。最初のレベルのソリューションは、現在人気のビッグ データ + ディープラーニングです。2 番目のレベルのソリューションはタスクの理解です。3 番目のレベルのソリューションは、物理的推論と人間の実用的な価値選択です。

彼は、真にタスク中心になるためには、コンピュータービジョン、認知科学、言語対話、機械学習、ロボット学習という 6 つの主要分野を統合した統一システムを構築する必要があると考えています。

汎用人工知能は、今後 10 ~ 20 年間、国際的な人工知能研究の最前線となり、競争の焦点となるでしょう。朱松春氏は汎用人工知能分野の重要な戦略的意義を強調し、「国家安全保障と経済発展の観点から、これは極めて重要な分野だと考えている。中国が国際競争に参加するための戦場でもある」と述べた。

朱松春氏の今回の中国への帰国は、国内の人工知能、特に汎用人工知能の発展に大きな推進力をもたらすだろう。彼はまた、「人工知能の大統一理論」という自身の夢に一歩近づいた。

<<:  機械学習エンジニアに必要な 5 つのソフトスキル

>>:  ドローン配送がレイアウトブームを巻き起こす、普及するには2つのポイントに注意が必要

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

Microsoft XiaoIce がスピンオフしました!沈向陽氏が会長に就任、「小氷の父」がCEOに就任、中国での事業化を目指す

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

海雲捷迅2018ビッグデータ博覧会ツアー——2018ビッグデータ博覧会人工知能世界大会決勝戦が終了

5月25日、2018年中国国際ビッグデータ博覧会人工知能世界大会決勝戦が予定通り貴陽で開催され、世界...

これほど長い時間が経ったのに、なぜ物流ロボットは何千もの家庭に導入されていないのでしょうか?

先日終了したCESで、ドイツのコンチネンタルAGは、新しい物流ロボット、荷物配達ロボット犬「ANYM...

ポスト絵読み時代、人工知能は絵の社会的ジレンマを解決できるのか?

ここ数年、国内の写真アプリが次々と登場しており、先頭にはDuitang、Huaban、Digu、Yo...

...

10億ピクセル画像のマルチスケール特性評価のためのスタンフォード大学の新しいニューラルシーン表現方法がSIGGRAPHに選出されました

現在、ニューラル表現は、レンダリング、イメージング、幾何学モデリング、シミュレーション アプリケーシ...

誰もが映画の「監督」! MSRA、北京大学、その他の大学が提案:ビデオ、映画、短編ビデオ生成モデル

Stable DiffusionとMidjourneyの人気以来、人々は画像生成の分野における人工知...

OpenAI と Mistral AI によって人気を博した MoE の背景にあるストーリーとは?ハイブリッドアーキテクチャの導入に関する包括的なガイド

専門家の混合 (MoE) は、LLM の効率性と精度を向上させるためによく使用される手法です。このア...

K近傍教師あり学習マシンアルゴリズムの詳細な分析

翻訳者 | 朱 仙中校正 | 梁哲、孫淑娟K 近傍法 (KNN) は、機械学習アルゴリズムにおける回...

Java と Python のアルゴリズムとデータ構造に関する面接の質問

Uber や Netflix などの企業でプログラミング、コーディング、ソフトウェア開発の職に応募す...

...

...