顔認識アルゴリズムは人間の認識能力を超えている

顔認識アルゴリズムは人間の認識能力を超えている

コンピューター科学者たちは、人間自身よりも顔を識別できる新しい顔認識アルゴリズムを開発した。

誰もが、かつて知っていた人を認識できないという経験をしたことがあるでしょう。これは、姿勢、照明、表情が変わると、実際には非常に難しいことです。コンピュータ認識システムにも同様の問題があります。実際、世界中のコンピューター科学者による長年の努力にもかかわらず、顔認識においては人間ほど強力なコンピューター認識システムはありません。

しかし、これは顔認識システムの精度が十分ではないということを意味するものではありません。逆に、最高の顔認識システムは、理想的な状況下では人間による認識よりもはるかに優れたパフォーマンスを発揮します。しかし、環境条件が悪化すると、システムのパフォーマンスは不十分になります。もちろん、コンピューター科学者は、あらゆる状況で優れたパフォーマンスを発揮するアルゴリズムを開発したいと考えています。

現在、香港大学の唐暁教授と彼の学生の陸超超(申し訳ありませんが、通訳者は学生の名前を見つけることができず、音訳することしかできませんでした)は、この問題を解決したと発表しました。彼らは、人間よりもはるかに優れた「ガウス」と呼ばれる顔認識アルゴリズムを開発しました。

新しい認識システムは、携帯電話からコンピュータ ゲームの顔認識、セキュリティ システムからパスワード制御まで、さまざまなプラットフォームで人間レベルの認識機能を提供できます。

[[112433]]

自動顔認識プログラムの場合、最初に考慮すべきことは、アルゴリズムをテストするための適切なデータセットを構築することです。そのためには、あらゆる人種、年齢、性別を考慮し、あらゆる種類の複雑な動き、照明、表情を持つさまざまな顔の非常に広範囲の画像が必要です。次に、服装、髪型、化粧などの他の要因の影響を調べる必要があります。

幸いなことに、さまざまな顔が登録された標準データベース「ラベル付き顔」がすでに存在します。ウェブ上から収集された、6,000 人以上の著名人の顔写真が 13,000 枚以上収録されています。さらに重要なのは、誰もが複数の顔写真を持っていることです。

もちろん、他の顔データベースもありますが、Labelled faces は現在、コンピューター科学者によって最も価値のあるテスト データ セットとして認識されています。

[[112434]]

顔認識のタスクは、2 つの異なる画像を比較し、それらが同一人物のものであるかどうかを判断することです。 (ここに表示されている画像のペアがそれぞれ同じ人物のものかどうかわかるかどうか試してみてください。)

このデータベースにおける人間のパフォーマンスは 97.53% の精度に達します。しかし、これまでにこの結果に匹敵するコンピューターアルゴリズムは存在しません。

この新しいアルゴリズムが登場するまでは。新しいアルゴリズムは、両目、鼻、口の角の位置という 5 つの画像特徴に基づいて、各顔画像を 150 x 120 ピクセルの画像に正規化します。

[[112435]]

次に、アルゴリズムは各画像を重複する 25 x 25 ピクセルの領域に分割し、数学的ベクトルを使用して各領域の基本的な特徴を記述します。これを実行した後、2 つの画像の類似性を比較できます。

しかし、まず何を比較するかを知る必要があります。このときにトレーニング データ セットが必要になります。一般的なアプローチは、独立したデータセットを使用してアルゴリズムをトレーニングし、次に同じデータセットの画像を使用してアルゴリズムをテストすることです。

しかし、アルゴリズムがトレーニング セット内の 2 つのまったく異なる画像に直面すると、それらを認識できないことがよくあります。 「画像の分布が変化すると、このトレーニング方法はまったく役に立たなくなります」とChaochao氏とXiaoou氏は言う。

[[112436]]

代わりに、研究者たちは、異なる画像を持つ 4 つのまったく異なるデータセットでガウスアルゴリズムをテストしました。たとえば、データセットの 1 つは有名な Multi-PIE データベースで、これには 15 種類の角度と 19 種類の照明条件で撮影された 337 個の異なるオブジェクトが 4 セットの写真に含まれています。 「Life Photes」と呼ばれる別のデータベースには、400 人の人物がそれぞれ 10 枚ずつ画像とともに含まれています。

これらのデータベースでアルゴリズムをトレーニングした後、最終的に Labelled Faces データベースで新しいアルゴリズムをテストしました。目標は、一致する画像ペアと一致しない画像ペアをすべて識別することです。

このデータベースにおける人間のパフォーマンスの精度は 97.53% であることを覚えておいてください。 「私たちの『ガウス』アルゴリズムは98.52%の精度を達成できます。これは認識アルゴリズムが人間に勝った初めてのケースです」とチャオチャオ氏とシャオウ氏は語った。

[[112437]]

データ内の写真の多様性を考慮すると、これは印象的な結果です。

Chaochao 氏と Xiaoou 氏は、彼らにはまだ多くの課題が待ち受けていると指摘した。実生活では、首や肩の位置など、さまざまな追加的な手がかりを使って識別することができます。 「超人的なパフォーマンスは象徴的な成果かもしれない」と彼らは語った。

もう 1 つの問題は、新しいアルゴリズムのトレーニングにかかる​​時間、アルゴリズムに必要なメモリの量、および 2 つの画像を認識するのにかかる時間です。これは、並列コンピューティングや専用プロセッサなどの技術を使用して、アルゴリズムの実行時間を短縮することで実現できます。

つまり、正確な自動顔認識アルゴリズムはすでに存在しており、現在の事実を考慮すると、今後はさらに高速化されるだろう。

<<:  Iconfinder が著作権侵害を排除する方法、ハッシュ アルゴリズムが画像の複製を検出

>>:  興味深い記事:女の子を追いかけるためのさまざまなアルゴリズムを教える

ブログ    
ブログ    
ブログ    

推薦する

ゼロサンプルのパフォーマンスが小サンプルのパフォーマンスを上回り、Google の新しい 1370 億パラメータ モデルは GPT-3 よりも強力

[[422681]] NLP の分野では、事前トレーニングの微調整とプロンプトチューニングの手法に...

ロボット工学の未来:人間とロボットのコラボレーション

IoT テクノロジー、ロボット、人間が相互運用されると、高度なロボット機能が実現され、新しいアプリケ...

Baichuan Intelligence が数千億のパラメータを持つ大規模モデルをリリース、その中国の能力は GPT-4 を上回る!

制作:51CTO テクノロジースタック(WeChat ID:blog) 「今年中にChatGPTのレ...

マイクロソフト、仕事の効率化に役立つ 7 つの新しい AI 製品を発表

Zhidongxi は 11 月 1 日に北京から、この日 (寒くて風が強い)、2017 Micro...

...

人工知能は厳しい規制の時代に入る

ChatGPTに代表されるLLM(Large Language Model)に基づく生成AIアプリケ...

写真とテキスト付き!推奨アルゴリズムのアーキテクチャ - 大まかなランキング

1. 全体的なアーキテクチャ粗いソートは、リコールと細かいソートの中間のモジュールです。 。数万の候...

...

AIブーム下のレイアウトトレンド

2016年3月にアルファ碁が囲碁の世界チャンピオン、イ・セドルを破って以来、人工知能は大きな注目を集...

2030年までに世界を制覇?ネイチャーが中国のAI開発の現状を深く分析

最近、ネイチャー誌は「中国は2030年までにAIの世界をリードできるか?」と題する記事を掲載した。記...

TensorFlow 学習ニューラルネットワーク構築

1. ニューラルネットワークを構築してレイヤーを追加する入力値、入力サイズ、出力サイズ、活性化関数ニ...

光と闇:人工知能と人類の未来

今日、人工知能 (AI) はほぼすべての業界とすべての人に影響を及ぼしています。この驚くべき技術は、...

...