顔認証ロック解除を使用するとき、携帯電話はどのようにしてあなたを「認識」するのでしょうか?顔認識について詳しく知る

顔認証ロック解除を使用するとき、携帯電話はどのようにしてあなたを「認識」するのでしょうか?顔認識について詳しく知る

2020年10月1日、私たちの祖国は71歳の誕生日を迎えました!

我が国は、最初の人工衛星の打ち上げから北斗システムのネットワーク化の成功まで、最初のハイブリッド米の栽培から農村地域におけるスマート農業の普及まで、最初の高速列車の出発から全国を走る高速鉄道の路線まで、過去71年間に世界に名だたる科学技術の成果を次々と達成してきました。あらゆる面で小康社会を築くという新しい時代において、科学技術は人々の生活とより密接に結びつき、科学技術産業は新たな使命を与えられています。

顔認識と人工知能の関係を理解し​​ていただきます〜

[[380242]]

「顔認証」は近年話題になっており、実生活のあらゆるところで目にすることができます。例えば、スマートフォンの顔認証ロック解除は高速かつ正確です。モバイル決済の「顔認証決済」は安全かつ便利です。住宅街での顔認証による入退室管理は鍵を忘れる手間を省きます。

さらに、携帯電話のスマートアルバムは、写真に写っている人物に応じて写真を自動的に分類することができ、美容カメラの特殊効果機能は、ユーザーが興味を持っている美容効果を提供することができます...

では、顔認識は技術的にはどのように実現されるのでしょうか?人工知能とどう関係するのでしょうか?

顔認識の誕生

顔認識技術は 1960 年代に始まり、1990 年代後半に応用段階に入り、現在では比較的成熟した技術となっています。顔認識アルゴリズムの基本的な考え方は、人物の「顔の特徴」を捉え、比較・分析することで人物を識別することです。

ある人のことを思い出したいとき、私たちはまず、その人のまぶたが二重かどうか、目の色は何色か、髪はカールしているかストレートか、鼻梁はどのくらい高いか、などを思い出すかもしれません。これらはいわゆる「顔の特徴」です。

しかし、非常によく似た 2 人の人物 (双子など) を肉眼で見分けるのは困難です。コンピューター支援による顔認識技術は、2 人の類似点と相違点を正確かつ迅速に識別できます。これは、顔認識アルゴリズムが、肉眼で観察できるよりもはるかに多くの「顔の特徴」を識別して記憶し、人々のより微妙な違いを捉えることができるためです。

顔認識とは、カメラやビデオカメラを使用して、人間の顔の特徴に基づいて顔を含む写真(またはビデオ)を取得し、写真(またはビデオ)内の顔を自動的に検出して追跡し、収集した顔に対して顔認識を実行する一連の方法です。

顔認識のプロセスは通常、顔検出、顔の位置合わせ、顔のエンコード、顔のマッチングの 4 つのステップに分かれています。

最初のステップは顔検出です。当然ですが、顔を区別する前に、まず写真の中で顔の位置を特定する必要があります。たとえば、市販の携帯電話で写真を撮ると、携帯電話が自動的に人の顔を四角でマークできることがわかります。これが顔検出技術の使用です。

[[380245]]

2 番目のステップは、顔の位置合わせです。写真内の顔の位置を検出した後、よく直面する問題は、写真内の顔が傾いていたり、横顔だけだったりすることです。

人間は、2 つの異なる方向を向いているときに同じ顔を簡単に認識できますが、コンピューターはそれを 2 つのまったく異なる ID として認識することがよくあります。

したがって、顔の位置合わせを完了するには、顔の特徴(目、鼻、口など)を見つけて、幾何学的変換(回転、拡大縮小など)を通じてこれらの特徴を対応する位置に移動する必要があります。

[[380247]]

3番目のステップは顔のエンコードです。最も直接的なアプローチは、検出して位置合わせした未知の顔を、すでにラベル付けした顔画像と比較することです。未知の顔が以前に注釈が付けられた顔と非常に似ている場合、同一人物である可能性が非常に高くなります。

しかし、この方法では、短時間で大量の写真の顔を認識することはできません。そのため、プログラマーが人工知能技術を使用してコンピューター内のニューラルネットワークをトレーニングし、同じ人物の2つの異なる顔写真と別の人物の顔写真を同時にコンピューター内のニューラルネットワークに入力して判断させ、このプロセスを継続的に繰り返す必要があります。

継続的なトレーニングプロセス中に、プログラマーは入力された同一人物の 2 枚の写真の違いを減らし、コンピューターがその人物の顔の特徴を学習できるようにします。

実際の認識では、事前にすべての人の顔画像を顔データベースに登録し、機械学習の比較方法(KNN分類器など)を使用して、見つけたい顔と顔データベースのデータを比較します。

4番目のステップは顔の照合です。これは最後のステップであり、最も簡単なステップでもあります。最初の 3 つのステップを終えると、コンピューターは私たちと同じように多くの人の顔の特徴を記憶します。顔照合技術を使用することで、コンピューターは写真ライブラリから対象人物に最も類似した写真を自動的に見つけることができます。

[[380249]]

人工知能と顔認識にはどのような関係があるのでしょうか?

人工知能には、インターネット、ビッグデータ、自然言語処理、コンピュータービジョンなど、多くの分野が関係しています。
その中でも、コンピュータービジョンは人間の活動に最も関連のある分野として、人工知能開発の全過程において極めて重要な位置を占めています。顔認識技術は、コンピュータービジョンの分野で長い間開発されてきた非常に成熟した技術です。人工知能とは何かを簡単に見てみましょう。
人工知能は、主にコンピュータプログラムを使用して人間の知能技術を提示する方法を研究し、さまざまな自動化機械または知能機械(主にコンピュータ)が人間の知能を学習、模倣、拡張、拡大できるようにすることを目的としています。

人工知能の学習プロセスは、私たちが幼い頃に両親が物体の認識を教えたときのプロセスに似ています。両親は子犬を指差して、それが犬だと教えてくれました。何度か注意深く教えられた後、私たちは、コミュニティ全体にいる毛むくじゃらで震えながら速く走る四足動物はすべて「犬」と呼ばれていることを知りました(ハスキー犬、テディ、または中国原産の犬であっても)。

プログラマーが何千枚もの犬の写真をコンピューターに入力することで、人工知能は物体を認識することを学習し、コンピューターはさまざまな犬の特徴(2つの目、4本の足、ふわふわの毛など)を認識し、人工知能ニューラルネットワークを構築できるようになります。次に、2 つの目と 4 本の足と毛皮を持つ、毛むくじゃらの生き物の写真を入力すると、コンピューターはそれが子犬であることを自然に認識します。

[[380250]]

2010年、人工知能技術が画像認識の分野に参入し始め、カメラを使った顔認識が現実のものとなりました。たとえば、公安部門はカメラを使用して顔認識を実行できます (カメラの顔が横顔、遮られた顔、暗い場所、ぼやけているかどうかに関係なく、今日の人工知能技術ではミリ秒レベルの検出を実現できます)。

さらに、人工知能技術を利用して監視画像を分析し、群衆の数、密度、性別、服装の特徴などをリアルタイムでマークすることもできます。他の国と比べて、私の国は膨大な顔のビッグデータリソースを持っています。人工知能をベースにした顔認識技術は、私たちの生活のあらゆる場面に応用されています。

人工知能は私たちにどのような影響を与えるのでしょうか?

現在、人工知能技術は私たちの生活に全面的に浸透し、スマートライフへの扉が開かれています。

顔認識に加えて、スマート医療の分野では、スマートロボットが医師の患者の診断と治療を支援しています。スマート交通の分野では、無人運転車が走行し始めています。スマートホームの分野では、さまざまなインタラクティブなスマートハードウェアが増加しています。スマート金融の分野では、人工知能がプロのファイナンシャルアドバイザーに取って代わり、顧客に完璧な金融ソリューションを提供できます...

[[380251]]

人工知能技術は私たちの生活に便利さをもたらしますが、潜在的な問題や限界もあります。

一方、人工知能技術はビッグデータに基づいており、個人情報の収集と処理を伴うため、必然的に個人のプライバシーの問題を避けることはできません。これには、管理機関が標準化されたデータ管理システムまたは対策を策定することが必要になります。

一方、人工知能自体には一定の技術的限界があり、すべての問題が人工知能によって解決できるわけではありません。

[[380252]]

技術の向上と進歩により、人工知能技術は将来ますます成熟し、人類にさらに大きな利益をもたらすと信じています。

<<:  映画に騙されないでください。人工知能はどうやって人間を殺すのでしょうか?

>>:  DeepGlint: 顔認識の最新の進歩と産業グレードの大規模な顔認識の実践に関する議論

ブログ    
ブログ    

推薦する

人工知能を背景にした教育の未来を探る

教育の分野では、人工知能の倫理に関する人々の考え方には複数の道が存在します。例えば、主観に基づく検討...

AIがサイバーセキュリティに与える影響

人工知能(AI)は、人間の知能をシミュレート、拡張、拡大するための理論、方法、技術、アプリケーション...

自動運転の簡単な分析 - 衝突防止警報システム

朝起きると、自分が遅く起きたことに気づきます。時間通りに会社に着いて出勤記録を残さないようにし、勤怠...

DL時代のコード補完ツールは言語モデルよりもはるかに効果的である

プログラマーからデータ エンジニアまで、プログラム コードを書くことは基本的なスキルですが、長いコー...

最新のロボット学習システムが登場、たった1本の動画で仕事内容を学習可能

近い将来、人間はロボットにやり方を一度見せるだけで、タスクの実行方法を教えることができるようになるか...

生成AI: 電子商取引の新たなフロンティア

AI の真の可能性が現れ始めたばかりですが、テクノロジーは電子商取引業界の生産性向上と優れた顧客サー...

半導体市場における人工知能の可能性と重要性

人工知能プロセッサは世界の半導体産業を活性化させており、少なくとも1つの市場調査会社は、AIチップの...

Zoomに狂った外国人がビデオ会議ロボットを開発、同僚たちはすでに大笑い

[[321983]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

マルウェアの検出と分類にディープラーニングが広く利用されている理由

人工知能 (AI) は進化を続けており、過去 10 年間で驚異的な進歩を遂げてきました。ディープラー...

OpenAI が静かに「価値観」を変更: AGI に全力で取り組んでいないなら関与しないでください

OpenAI はひっそりとその中核となる価値観を変えました。公式ウェブサイトに掲載されている6つのコ...

AI リサーチ インスティテュートが 2021 年の AI 技術トレンド トップ 10 を発表

[[374480]] 12月31日、AI研究所は2020年のAIの進歩トップ10を発表しました。新年...

海外メディア:NvidiaはARMアーキテクチャに基づくPCチップを設計しており、早ければ2025年に発売される予定

10月24日、チップ大手のNvidiaが人工知能(AI)コンピューティングチップ市場を独占した。現在...

トランスフォーマーの簡易版がここにあります、ネットユーザー:今年の論文

Transformer アーキテクチャは、ディープラーニング分野における最近の多くの成功の原動力であ...

機械学習におけるよくある間違い

序文エンジニアリングでは、キーバリューストアを構築する方法が複数あり、それぞれの設計では使用パターン...

...