Facebookは色を表現するために通信する2つのニューラルネットワークを作成

Facebookは色を表現するために通信する2つのニューラルネットワークを作成

色をどのように表現するか考えたことはありますか?最新の研究によると、人間は個別の記号を使用して領域の色を記録し、色を洗練させる過程で他の情報を追加していることがわかりました。これには何か理由があるのでしょうか? Facebook は 2 つのニューラル ネットワークの実験的現象を使用して情報をお伝えします。

人間の世界には何千もの言語がありますが、さまざまな色を表すために言葉を使用する方法は非常に一貫しています。

たとえば、多くの言語には赤とオレンジを表す 2 つの異なる単語がありますが、オレンジのさまざまな色合い (色がオレンジとオレンジ色) を表す、明確に区別された共通の単語が多数ある言語はありません。

たとえば、多くの口紅の色合いのそれぞれに固有の色名が割り当てられていたら、それを覚えるのは困難でしょう。

[[390533]]

言語学者たちは数学的なツールを使って、色の名前にこのような一貫性があるのは、人間が正確にコミュニケーションする必要性と記憶を最小限に抑える必要性のバランスを取るために言語を最適化しているからだと示しました。

追加の色の言葉を使用すると複雑さが増しますが、人々のコミュニケーション能力が大幅に向上することはありません。

Facebookの最近のAI研究では、2つの人工ニューラルネットワークに、見た色について互いに通信する方法を作成するように依頼したところ、AIも人間と同じように複雑さと正確さのバランスをとったことが示されました。

さらに、Facebook の研究チームは、連続した色空間を正確に記述するには、離散的な「色言語」しか使用できないことも発見しました。

これにより、コミュニケーションがどのように機能するかについての興味深い推測が生まれます。動物の「連続的な」鳴き声よりも、「離散的な」象徴的な言語の方がコミュニケーションに適しているということでしょうか?

モデル実装プロセス

まず、話す側(話者)と聞く側(聞き手)の 2 つのニューラル ネットワークを構築し、「コミュニケーション ゲーム」を確立します。ゲームの各ラウンドで、話者は連続した色空間から色を見て、シンボル(「単語」と見なすことができます)を出力します。リスナーはノイズ入力と同じ色または異なる色を見る場合があります。

リスナーはスピーカーが出力した単語を受け取り、正しい色のフラグメントを出力しようとします。最初は、スピーカーはランダムに単語を生成し、トレーニングの終わりまでに、各単語は色空間の連続した部分を表します。

研究チームは、ターゲット色とノイズ色の類似性を変えることでタスクの難易度を変えながら、実験を数回繰り返した。これらのバリエーションにより、色を命名するためのさまざまな「語彙」が生まれました。

訓練の最後に研究者らは語彙を分析し、AIが生成した色を表す言葉が人間の言語と性質が似ていることを発見した。さらに、どちらのタイプの言語も、複雑さと精度の間の可能な限り最良のトレードオフのセットを正式に定義する境界に近いです (図の黒い線)。

研究者らはその後の実験で、ニューラルネットワークが離散的なシンボルではなく連続的なシンボルを使用して通信できるようにした場合、複雑さと精度の間の最適なバランスが存在しなくなることを発見した。

2 つのニューラル ネットワークは引き続き通信できますが、通信効率は非常に低くなります。

言語はおそらく人間の最もユニークな特徴であり、私たちはそれを理解することなく日常生活で絶えず使用しています。

Facebook の研究によると、高度な AI モデルは実用的なアプリケーションに役立つだけでなく、人間の言語 (および一般的な認知) に関する科学的な疑問に答えるための実験ツールとしても機能することが示されています。

<<:  10 分でチャットボットを作成するにはどうすればよいでしょうか?

>>:  バグがあります! PyTorch が AMD CPU 搭載のコンピューターでハングする

ブログ    

推薦する

自動運転車におけるサイバーセキュリティの役割

自動車業界は、安全性、持続可能性、接続性、全体的なユーザーエクスペリエンスを向上させるソフトウェアの...

...

教育省は小中学校の人工知能教育拠点のリストを発表し、北京洪志中学校を含む184校が選ばれた。

教育部基礎教育司は1月11日、「教育部弁公庁による小中学校向け人工知能教育拠点の推薦に関する通知」(...

...

合成データは AI をより良くすることができるでしょうか?

人工知能 (AI) は指数関数的な成長によりさらに進歩していますが、この最新技術には依然として限界が...

テンセント・フンユアン・ビッグモデル・アップグレード:「文勝図」を追加し、コード能力を大幅に向上

テンセントは10月26日、テンセント渾源モデルが新たなアップグレードを経て、「文勝図」機能を正式に公...

Appleは以前から独自のChatGPT AIツールを開発してきた。

何年もの間、自社のソフトウェアとデバイスすべてに機械学習を統合してきたAppleは、WWDCでは自社...

人工知能とインテリジェント人工知能、AIの開発はデータサポートから切り離せない

AIは半世紀以上もの間、低調でしたが、囲碁の人工知能プログラム、AI茶室、AI+医療、AI+交通など...

AIはもはや派手なものではなく、日常生活にもっと関連している

2020年に入り、業界におけるAIの発展は単なる技術革新やブレークスルーの範囲を超え、製品と業界の統...

ミュンヘンモーターショーからのシグナル:自動車メーカーがOS開発に躍起になり、中国の力が増す

今年ドイツで開催された国際自動車・スマートモビリティ博覧会(IAA)では、Amazon、Qualco...

...

...

Googleは「ロボット工学の3原則」をシステムに導入:ロボットが人間に危害を加えることを厳しく防止

1月5日、有名なSF作家アイザック・アシモフが「ロボット工学三原則」を提唱しました。 Googleは...

この記事では、ロボットが視覚を通じてターゲット追跡を実現する方法を説明します。

概要: 視覚追跡技術は、コンピュータービジョン(人工知能の一分野)の分野における重要なトピックであり...