AI は驚異的な進歩を遂げていますが、多くの分野ではまだ限界があります。たとえば、コンピューター ゲームでは、AI エージェントにゲームのルールが事前にプログラムされていない場合、正しい選択を決定するまでに何百万回も試行する必要があります。人間は言語の使用を通じて過去の知識を新しいタスクに転用することに長けているため、同じ偉業をはるかに短い時間で達成することができます。 ドラゴンを倒すゲームでは、AI エージェントはドラゴンを倒さなければならないことを理解するまでに、他の多くのアクション (壁や花に向かって火を吐くなど) を試す必要があります。しかし、AIエージェントが言語を理解していれば、人間は言語を使って「ゲームに勝つにはドラゴンを倒せ」と指示するだけで済みます。 視覚ベースの言語は、人間がスキルを一般化し、それを新しいタスクに適用する上で重要な役割を果たしますが、これは機械にとって依然として大きな課題です。機械が真に知的になり、人間のように学習する能力を獲得するには、複雑な言語システムを開発することが不可欠です。 この目標に向けた第一歩として、Baidu IDL Lab は、教師あり学習と強化学習を組み合わせたシステムを開発しました。このシステムにより、親が赤ちゃんに教えるのと同じように、仮想教師が言語を知覚と行動に結び付けて仮想 AI エージェントに言語を教えることができます。 IDL Labの結果によると、トレーニング後、AIエージェントは教師の指示を自然言語で正しく解釈し、対応するアクションを実行できることがわかりました。さらに、AIエージェントは「ゼロショット学習能力」を発達させ、つまり、根底にある文章を理解できるようになったことを同研究所は発見した。「この研究は、機械に人間のように学習することを教えることに一歩近づくものだ。」 論文リンク: http://arxiv.org/abs/1703.09831 研究概要 この研究は、XWORLDと呼ばれる2D迷路のような環境で実施されました。Baiduの仮想エージェントは、仮想教師が発行した自然言語のコマンドに基づいてこの環境をナビゲートする必要がありました。最初は、エージェントはこの言語について何も知らず、すべての単語は同じように意味をなさない。 しかし、ロボットが環境を探索する際に、ロボットがコマンドの実行に成功した場合(または失敗した場合)には、教師は肯定的(または否定的)に応答します。 エージェントがより速く学習できるように、教師はエージェントが移動する際に環境に関する簡単な質問も行います。エージェントは質問に正しく答える必要があります。正しい行動/回答を奨励し、誤った行動/回答を罰することで、教師は多くの試行錯誤を経て、エージェントが自然言語を理解できるようにトレーニングすることができます。 コマンドの例には次のようなものがあります。
いくつかのQ&Aの例:
結果 最終的に、エージェントは教師のコマンドを正しく解釈し、正しい場所に移動できるようになります。さらに、このエージェントは研究チームが「ゼロショット学習能力」と呼ぶ能力を発達させた。これは、エージェントがこれまで見たことのないまったく新しいコマンドを提示された場合でも、以前に同様の形式の文章を十分に見たことがあれば、タスクを正しく実行できることを意味する。言い換えれば、エージェントは既知の単語で構成された新しい文を既知の方法 (文法) で理解することができます。 たとえば、ナイフでリンゴを切る方法を学んだ人は、ナイフでドラゴンフルーツを切る方法も知っているでしょう。過去の知識を新しいタスクに適用することは人間にとっては非常に簡単ですが、現在のエンドツーエンドの学習マシンにとっては依然として困難です。 機械は「ドラゴンフルーツ」がどのような見た目かは知っているかもしれませんが、そのコマンドを含むデータセットを使用して明示的にトレーニングされていない限り、「ナイフでドラゴンフルーツを切る」というタスクを実行することはできません。対照的に、私たちのエージェントは、まったく同じことについてトレーニングを受けなくても、ドラゴンフルーツの見た目や「ナイフで切る」タスクに関する知識を転送する能力を示しています。 下の図は、エージェントがナビゲーション タスク テストを正常に実行していることを示しています。 ナビゲーションステートメント
文章を識別する
ナビゲーションテスト
ナビゲーションステートメント
ナビゲーションテスト
Baidu Research Institute の追跡調査には 2 つの方向性があります。
Baidu の最終的な目標は、人間が自然言語を使用して実際の環境で本物のロボットを訓練できるようにすることです。 |
<<: 機械学習業界の発展はなぜ「オープンソース」から切り離せないのか
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[321591]] 「今後数十年で1000万人以上の命を奪うようなことがあれば、それは戦争ではなく...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
まず、一般的なビザンチン将軍問題からコンセンサスとは何かを理解しましょう。ビザンチン将軍問題ビザンチ...
現在、人類は急速に人工知能の時代に突入しています。人工知能技術の急速な発展、モノのインターネット、ビ...
最近、世界インターネット会議で「世界インターネット発展報告書2020」が発表されました。報告書では、...
自動化はテクノロジーを利用して、人間がより多くのタスクを完了できるようにします。物流の自動化をあらゆ...
近年、人工知能(AI)は芸術作品の創造において驚くべき能力を発揮しています。テキストボックスに文章を...
[[197022]]新しく購入した水冷なしのパブリック版GPUの温度は、フル負荷で稼働すると室温から...
序文最近、突然素晴らしいアイデアが浮かびました。コンピューターの画面に顔を向けると、コンピューターは...
来月、大手自動車メーカーのグループが米国でブロックチェーンベースの車両識別ネットワークの初のフィール...
[[337082]]最近、グラスゴー大学コンピューティング科学学部のデータサイエンス研究者であるアレ...
ビッグデータダイジェスト制作著者: カレブ空には太陽が輝き、花々は私に微笑みかけ、鳥たちは「おはよう...
現在、建設部門は大規模なプロジェクトによって活性化しており、大きな成長を牽引しています。しかし、これ...
テスラとペイパルの創業者イーロン・マスク氏は、将来私たちのほとんどが職を失うとさえ言っており、人工知...