顔認識アルゴリズムは人間の認識能力を超えている

顔認識アルゴリズムは人間の認識能力を超えている

コンピューター科学者たちは、人間自身よりも顔を識別できる新しい顔認識アルゴリズムを開発した。

誰もが、かつて知っていた人を認識できないという経験をしたことがあるでしょう。これは、姿勢、照明、表情が変わると、実際には非常に難しいことです。コンピュータ認識システムにも同様の問題があります。実際、世界中のコンピューター科学者による長年の努力にもかかわらず、顔認識においては人間ほど強力なコンピューター認識システムはありません。

しかし、これは顔認識システムの精度が十分ではないということを意味するものではありません。逆に、最高の顔認識システムは、理想的な状況下では人間による認識よりもはるかに優れたパフォーマンスを発揮します。しかし、環境条件が悪化すると、システムのパフォーマンスは不十分になります。もちろん、コンピューター科学者は、あらゆる状況で優れたパフォーマンスを発揮するアルゴリズムを開発したいと考えています。

現在、香港大学の唐暁教授と彼の学生の陸超超(申し訳ありませんが、通訳者は学生の名前を見つけることができず、音訳することしかできませんでした)は、この問題を解決したと発表しました。彼らは、人間よりもはるかに優れた「ガウス」と呼ばれる顔認識アルゴリズムを開発しました。

新しい認識システムは、携帯電話からコンピュータ ゲームの顔認識、セキュリティ システムからパスワード制御まで、さまざまなプラットフォームで人間レベルの認識機能を提供できます。

[[112433]]

自動顔認識プログラムの場合、最初に考慮すべきことは、アルゴリズムをテストするための適切なデータセットを構築することです。そのためには、あらゆる人種、年齢、性別を考慮し、あらゆる種類の複雑な動き、照明、表情を持つさまざまな顔の非常に広範囲の画像が必要です。次に、服装、髪型、化粧などの他の要因の影響を調べる必要があります。

幸いなことに、さまざまな顔が登録された標準データベース「ラベル付き顔」がすでに存在します。ウェブ上から収集された、6,000 人以上の著名人の顔写真が 13,000 枚以上収録されています。さらに重要なのは、誰もが複数の顔写真を持っていることです。

もちろん、他の顔データベースもありますが、Labelled faces は現在、コンピューター科学者によって最も価値のあるテスト データ セットとして認識されています。

[[112434]]

顔認識のタスクは、2 つの異なる画像を比較し、それらが同一人物のものであるかどうかを判断することです。 (ここに表示されている画像のペアがそれぞれ同じ人物のものかどうかわかるかどうか試してみてください。)

このデータベースにおける人間のパフォーマンスは 97.53% の精度に達します。しかし、これまでにこの結果に匹敵するコンピューターアルゴリズムは存在しません。

この新しいアルゴリズムが登場するまでは。新しいアルゴリズムは、両目、鼻、口の角の位置という 5 つの画像特徴に基づいて、各顔画像を 150 x 120 ピクセルの画像に正規化します。

[[112435]]

次に、アルゴリズムは各画像を重複する 25 x 25 ピクセルの領域に分割し、数学的ベクトルを使用して各領域の基本的な特徴を記述します。これを実行した後、2 つの画像の類似性を比較できます。

しかし、まず何を比較するかを知る必要があります。このときにトレーニング データ セットが必要になります。一般的なアプローチは、独立したデータセットを使用してアルゴリズムをトレーニングし、次に同じデータセットの画像を使用してアルゴリズムをテストすることです。

しかし、アルゴリズムがトレーニング セット内の 2 つのまったく異なる画像に直面すると、それらを認識できないことがよくあります。 「画像の分布が変化すると、このトレーニング方法はまったく役に立たなくなります」とChaochao氏とXiaoou氏は言う。

[[112436]]

代わりに、研究者たちは、異なる画像を持つ 4 つのまったく異なるデータセットでガウスアルゴリズムをテストしました。たとえば、データセットの 1 つは有名な Multi-PIE データベースで、これには 15 種類の角度と 19 種類の照明条件で撮影された 337 個の異なるオブジェクトが 4 セットの写真に含まれています。 「Life Photes」と呼ばれる別のデータベースには、400 人の人物がそれぞれ 10 枚ずつ画像とともに含まれています。

これらのデータベースでアルゴリズムをトレーニングした後、最終的に Labelled Faces データベースで新しいアルゴリズムをテストしました。目標は、一致する画像ペアと一致しない画像ペアをすべて識別することです。

このデータベースにおける人間のパフォーマンスの精度は 97.53% であることを覚えておいてください。 「私たちの『ガウス』アルゴリズムは98.52%の精度を達成できます。これは認識アルゴリズムが人間に勝った初めてのケースです」とチャオチャオ氏とシャオウ氏は語った。

[[112437]]

データ内の写真の多様性を考慮すると、これは印象的な結果です。

Chaochao 氏と Xiaoou 氏は、彼らにはまだ多くの課題が待ち受けていると指摘した。実生活では、首や肩の位置など、さまざまな追加的な手がかりを使って識別することができます。 「超人的なパフォーマンスは象徴的な成果かもしれない」と彼らは語った。

もう 1 つの問題は、新しいアルゴリズムのトレーニングにかかる​​時間、アルゴリズムに必要なメモリの量、および 2 つの画像を認識するのにかかる時間です。これは、並列コンピューティングや専用プロセッサなどの技術を使用して、アルゴリズムの実行時間を短縮することで実現できます。

つまり、正確な自動顔認識アルゴリズムはすでに存在しており、現在の事実を考慮すると、今後はさらに高速化されるだろう。

<<:  Iconfinder が著作権侵害を排除する方法、ハッシュ アルゴリズムが画像の複製を検出

>>:  興味深い記事:女の子を追いかけるためのさまざまなアルゴリズムを教える

推薦する

脳内の画像を高解像度で復元できるようになりました

近年、画像生成、特にテキストから画像への生成の分野で大きな進歩が遂げられており、アイデアをテキストで...

...

...

ビジネスリーダーがAIを導入する際に指針となる5つの基本原則

たとえば、私が 25 年以上携わってきた市場調査業界を考えてみましょう。 AI は、さまざまな方法で...

技術者でなくても、クラウド コンピューティング、ビッグ データ、人工知能を理解することができます。

今日は、クラウド コンピューティング、ビッグ データ、人工知能の 3 つのトピックについてお話しした...

2021年の中国の医療人工知能産業の展望

医療用人工知能製品は多様化しており、下流の需要は強い医療人工知能産業の上流は、主に医療データマイニン...

16歳の高校生が13,000行以上のコードでC++機械学習ライブラリをゼロから作成した

コンピューターが大好きなティーンエイジャーは、16歳にしてすでに、広東語プログラミング言語の開発、K...

...

マスク氏が選んだ天才少年:14歳でスペースXの最年少エンジニアとなり、年俸100万、2歳で学び始め、11歳で大学へ進学

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ある日、お子さんが「お父さん、機械学習って何?」と尋ねたとします。

お父さん、機械学習って何ですか?答えるのは難しい!髪の毛が抜け始めた頭を掻いた後でも、お父さんはこの...

2024年の最大の落とし穴は?ディープラーニングに基づくエンドツーエンドの自動運転の最新レビュー

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

5G時代、移動ロボットは知能でどのように勝利できるのでしょうか?

移動ロボットは、環境認識、動的意思決定と計画、行動制御と実行などの複数の機能を統合した総合システムで...

...

JavaScript は機械学習にも使えます。オープンソースの JavaScript 機械学習フレームワーク 5 つを推奨します

3か月前、同社のAIチームは、写真や動画に映る有名人やランドマークを分析するために機械学習を活用する...