信じられますか?人工知能は最近、あなたの声からわずか6秒で性別、年齢、人種を判別し、さらにはあなたの外見を説明できるまでに進化しました。
この AI はマサチューセッツ工科大学 (MIT) によって作成されました。研究者は、何百万ものビデオ クリップで構成されたデータ セットを使用して、Speech2Face と呼ばれるニューラル ネットワーク モデルを自己トレーニングしました。このネットワークの動作は、大きく 2 つの部分に分かれています。1 つは音声エンコーダーで、主に入力された音声を分析し、関連する顔の特徴を予測する役割を担っています。もう 1 つは顔デコーダーで、主に入力された顔の特徴を統合して画像を生成する役割を担っています。最終結果から判断すると、音に基づいて人の顔を復元するのにたった 6 秒しかかからず、効果は満足のいくものでした。 研究チームは、話者の外見を正確に復元することが目的ではないと述べた。Speech2Faceモデルは主に、音声と外見の相関関係を研究するために使用される。現在、Speech2Faceは性別を認識でき、白人とアジア人を簡単に区別できます。年齢で言えば、30代、40代、70代の音声のヒット率が高くなります。 Speech2Faceは、基本的な性別、年齢、人種に加えて、鼻の構造、唇の厚さや形、噛み合わせなど、いくつかの顔の特徴も推測できます。また、おおよその顔の骨格を推測することもできます。基本的に、音声入力時間が長いほど、このAIの精度は高くなります。ただし、研究者はAIの聴覚が間違っている可能性もあることを認めています。このAIは、まだ声変わり期を経験していない小さな男の子を女性と間違えたり、話者のアクセントを誤って判断したり、年齢を間違えたりする可能性があります。研究者らは、Speech2Faceの限界はデータセット内の話者の間に人種的多様性が欠けていることに一部起因しており、異なる人種の人々の声を認識する能力が低いと述べた。 しかし、この技術の背後に隠れているプライバシーや差別の問題が懸念されると考える人もいます。これは純粋に学術的な調査ではあるものの、顔情報の潜在的な機密性については、倫理的要素についてさらに議論する必要があると彼らは考えています。厳格な技術テストを実施し、実際のデータが想定されるユーザー グループを代表できることを確認する必要があります。 |
<<: 人工知能の未来は人類にとって何を意味するのでしょうか?
>>: F1カーがハッキングされた、人工知能技術が救世主となるのか?
教育改革と人工知能の普及に伴い、キャンパスのインテリジェント構築もデジタルキャンパスからスマートキャ...
フロスト&サリバンによる最近の分析によると、スマートシティ技術への世界的な投資は2025年までに22...
10月9日のニュースによると、AIビッグモデルは近年、人工知能の分野で話題になっており、リアルなテ...
[[206942]]国内外の権威ある20の機関のEconomic Information Daily...
最近、英国のテクノロジー企業エンジニアード・アーツが開発したヒューマノイドロボット「アメカ」がインタ...
[[186071]]今日、私は BAT のアルゴリズム エンジニアに再び拒否されました。はい、お読み...
[[394975]]基数ソート基数ソートは「分散ソート」に属し、「バケット ソート」または「ビン ...
はじめに:強力な人工知能の開発は近年の関心事となっています。単にラベル付けされたデータではなく、人間...