人工知能の「想像力」を実現する

人工知能の「想像力」を実現する

[[416371]]

[51CTO.com クイック翻訳]まず、オレンジ色の猫を頭の中で想像してください。次に、同じ猫の毛が真っ黒になっているところを想像してください。さて、そんな猫が万里の長城に沿って闊歩しているところを想像してみてください。

こうした想像の最中、脳内の一連のニューロンが、世界に対するこれまでの理解に基づいて、さまざまなイメージを素早く生成します。つまり、人間は異なる特性を持つ物体を持つことが容易なのです。しかし、コンピューターに関しては、ディープ ニューラル ネットワークが特定のタスクにおいて人間のパフォーマンスに匹敵、あるいはそれを凌駕するほどの画期的な成果を上げているにもかかわらず、人間の「想像力」に対抗することはまだできていない。

現在、USC の研究者チームは、人間のような能力を使って、これまでとは異なる特性を持つ物体を想像する新しい AI を開発しました。この論文「Zero-Shot Synthesis with Group-Supervised Learning」は、今年5月7日にICLR2021(ディープラーニング分野のトップ学術会議)で発表されました。

「私たちは人間の視覚の一般化能力にヒントを得て、人間の想像力を機械でシミュレートしようとしました」と、この研究の主執筆者であるユンハオ・ゲ氏は語った。「人間は、学習したことをさまざまな属性(形状、姿勢、位置、色など)で分離し、それらを再結合して新しい物体を想像することができます。私たちの論文は、ニューラルネットワークを使用してこのプロセスをシミュレートしようとしています。」

人工知能の一般化

たとえば、車の画像を生成する AI システムを作成したいとします。理想的には、アルゴリズムに車の写真を何枚か入力して、ポルシェからポンティアック、ピックアップトラックまで、あらゆるメーカー、形状、色の車の写真をさまざまな角度から生成させることができます。

これは人工知能が長年追求してきた目標の 1 つであり、推論を実行できるモデルを作成することです。この目標を達成するということは、いくつかの例が与えられた場合に、モデルが基本的なルールを抽出し、それをこれまでに見たことのない多数の新しい例に適用できることを意味します。しかし、機械は通常、オブジェクトの属性を考慮せずに、ピクセルなどのサンプルの特徴に基づいてトレーニングされます。

想像力の科学

新しい研究では、研究者らは「分離」と呼ばれる概念を使ってこの限界を克服しようとした。 「デエンタングルメント」は「ディープフェイク」にも利用でき、葛雲豪氏は、人の顔の表情や特徴を「デエンタングルメント」して「フェイススワッピング」することで、元の動きはそのままに、元の持ち主のアイデンティティを別の人物に置き換え、新たな画像や動画を合成できると述べた。同様に、新しい手法では、従来のアルゴリズムのように一度に 1 枚ずつではなく、サンプル画像のセットを取得し、それらの類似点を掘り起こして、「制御可能な分離表現学習」と呼ばれるものを実現します。そして、この知識を組み換えることで、「新しいイメージの制御可能な合成」、つまり「想像力」を実現します。

彼はトランスフォーマーの例を挙げた。メガトロンの形、バンブルビーの色、ニューヨークのタイムズスクエアの背景などは映画から取り入れることができる。その結果、訓練中には見ら​​れなかったものの、タイムズスクエアを疾走するバンブルビー色のメガトロンカーが誕生した。

このプロセスは人間の推論に似ています。人間が 1 つの物体の色を見ると、元の色を新しい色に置き換えることで、その色を他の物体に簡単に適用できます。研究チームはこの技術を使って、この分野の将来の研究に役立つ156万枚の画像の新しいデータセットを生成した。

世界を理解する

もつれ解除は新しいアイデアではないが、研究者らは、このフレームワークはほぼあらゆる種類のデータや知識と互換性があり、応用の機会が広がると述べている。たとえば、敏感な属性を方程式から完全に排除し、人種や性別に関する知識を除外することで、AI はより公平になる可能性があります。

例えば、医療分野では、薬物の機能を他の特性から分離し、それらを再結合して新しい薬物を合成することで、医師や生物学者がより有用な薬物を発見するのに役立ちます。自動運転の分野では、自動運転車がトレーニング中に見たことのない危険なシナリオを想像して回避できるようにすることで、より安全な人工知能の作成を促進します。

「ディープラーニングは多くの分野で比類のないパフォーマンスと将来性を示してきましたが、これは多くの場合、各個人をユニークにする特性を深く理解することなく、浅はかな模倣によって達成されてきました」と、コンピューターサイエンスの教授であるローレン・イッティ氏は語ります。「この新しい『脱エンタングルメント』アプローチは、AIシステムの想像力を真に解き放ち、それを人間の世界理解に近づける初めてのものです。」

オリジナルリンク: 人工知能の「想像力」を可能にする

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  中国は人工知能研究で米国を追い越している

>>:  Githubには13,000個のスターがある。JAXの急速な発展はTensorFlowやPyTorchに匹敵する

ブログ    
ブログ    

推薦する

AIOpsを始める前に知っておくべきこと

AIOps は、その優れたパフォーマンスにより、業界で幅広い注目と支持を集めています。AIOps が...

AIの冬が来ます!ディープラーニングはスケールしません...

著者について: Filip Piekniewski は、コンピューター ビジョンと AI の専門家で...

...

人工知能オープンプラットフォームの構築が活況を呈しており、AIの将来の発展は有望である

人工知能は、応用と開発のチャンスの時代をもたらしました。人工知能は、新たな産業変革の原動力であるだけ...

実際に大規模な戦争を指揮しているのはビッグデータと人工知能なのでしょうか?

ビッグデータと人工知能はどれほどの力を持っているのでしょうか。ほとんどの人はまだそれを直感的に理解し...

COVID-19パンデミックは顔認識技術の導入を促進している

COVID-19は顔認識技術の使用にどのような影響を与えるでしょうか? [[374366]] #p#...

...

中国と米国の差を縮め、人工知能開発の主導権を徐々に握る

60年以上の発展を経て、人工知能は人々の仕事や日常生活に入り込み、影響を与えており、新たな一般技術と...

論文の90%はモデル中心です。AIの分野では、データとモデルのどちらが重要ですか?

モデルとデータは AI システムの基盤であり、これら 2 つのコンポーネントはモデルの開発において重...

ニューラルネットワーク技術の進化について

ニューラル ネットワークとディープラーニング技術は、今日の高度なインテリジェント アプリケーションの...

人工知能が将来経験する7つの段階

2030年までに、人工知能のおかげで世界のGDPは15.7兆ドル増加するでしょう。企業の 84% は...

中国科学院のチームは、最初のLLMモデル圧縮レビューを発表しました。剪定、知識蒸留、量子化技術の詳細な議論です。

最近、大規模言語モデル (LLM) はさまざまなタスクで優れたパフォーマンスを示しています。しかし、...

ディープラーニングとマシンビジョンの重要性を分析!ロボットを自由にさせる?

ディープラーニングは産業用ロボットの中核技術であり、ロボットが制約から解放され、環境の変化に応じて自...

AAAI2018にはアリババからの11の論文が収録され、6人の著者がメインカンファレンスでプレゼンテーションを行うよう招待されました。

2018年の初め、アリババは人工知能の分野での最新の成果を発表しました。人工知能に関するトップ学術...