画像認識が最も得意な会社はどこでしょうか? Microsoft、Amazon、Google、それともIBM?

画像認識が最も得意な会社はどこでしょうか? Microsoft、Amazon、Google、それともIBM?

[51CTO.com クイック翻訳] 認識ソフトウェアは、特定の種類の画像を正しく分類するのに非常に優れていますが、他の種類の画像を正しく分類できない場合があります。画像認識エンジンの中には、犬よりも猫を好むものや、色彩に関する専門知識を持ち、非常に詳細な説明ができるものもあります。しかし、総合的に見てどれが一番良いのでしょうか?

Perficient Digital の画像認識精度調査では、機械学習の最もホットな分野の 1 つである画像認識を分析しました。画像を比較するために、Amazon AWS Rekognition、Google Vision、IBM Watson、Microsoft Azure Computer Vision を調べました。

3 人のユーザーが、チャート、風景、人物、製品の 4 つのカテゴリで比較するために、2,000 枚の画像を手動でラベル付けしました。

研究チームは、画像認識エンジンによって提供される各ラベルの精度を測定する精度評価 (画像 500 枚) と、画像認識エンジンによって提供されるラベルが各画像を人間が説明する方法とどのように比較されるかを判断する人間による説明の一致 (画像 2,000 枚) という 2 つの異なる指標を使用して各エンジンを評価しました。

500 枚の画像の精度評価セクションでは、画像認識エンジンからの各ラベルが、「はい」、「いいえ」、「わかりません」の正確性に基づいて評価されました。ラベルのわずか 1.2% が「不明」とマークされていました。

人間が画像を説明するために使用しない可能性のあるラベルが含まれている場合でも、ラベルは正確であるとマークされます。

純粋な精度という点では、4 つのエンジンのうち 3 つ (Amazon、Google Vision、Microsoft Azure Computer Vision) が人間のラベル付け担当者よりも高いスコアを獲得し、ラベルの信頼度レベルは 90 パーセントを超えました。

この分析では、Google がすべてのカテゴリーで明らかにトップとなり、Amazon AWS Rekogniton が 2 位となりました。精度に関しては、エンジンラベルの信頼度が 90% 以上の場合、4 つのエンジンのうち 3 つが人間のラベル付け者よりも高いスコアを獲得しました。

図1

この研究では、エンジンによって生成された説明が、ユーザーが画像を説明する方法とどの程度一致しているかについても分析しました。残念ながら、この点はあまり良くありません。

各エンジンに対して言語分析を実行し、認識エンジンに偏りがないか確認します。 Amazon が製品に対して明らかな偏見を持っていることは驚くことではありません。

人間が手動でラベル付けした画像は、どのエンジンよりもはるかに高いスコアを獲得しました。正確なラベルと人間が画像を説明するために使用するラベルとの間には明らかな違いがあります。

図2

IBM Watson が色を優先していることは注目に値します。他のエンジンと比較して、スチールブルー、ブルー、アイアンブルー、パープルブルーなどの単語を使用して、最も多くの色の説明を提供します。 Microsoft Azure Computer Vision は、ぼやけ具合や不鮮明さなどの画像の品質を記述できます。

IBM Watson は、U 字型 (川)、アラベスク (装飾)、トレッキング ポール (登山用具) などの非常に説明的な単語を好みます。 Amazon AWS Rekognition は衣類を優先し、他の API よりもショートパンツ、パンツ、シャツの識別に優れています。

Google Vision は猫の品種を優先し、IBM Watson は他のエンジンよりも多くの犬の品種を認識します。

Smart Images AI Evaluator を試してみて、自分の画像をいくつかアップロードして、自分の結果を確認してください。 Perficient Digital 社が開発したこのツールは、Adobe、Google、IBM、Microsoft の画像認識エンジンが画像にタグを付ける方法を比較します。結果がいかに良いかに驚かれるかもしれません。

原題: 画像認識で最も優れている企業はどれか? Microsoft、Amazon、Google、それとも IBM?、著者: Eileen Brown

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  米シンクタンクの報告書:中国のAI人材流出、大半が米国へ

>>:  自動車業界における 5G の登場は、車両のインターネットと自動運転の普及にどのように役立つのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

スーパーマーケットチェーンのシュナックスは、米国の111店舗にシムベのロボット技術を導入すると発表

海外メディアのTechCrunchによると、セントルイスに本拠を置くスーパーマーケットチェーン「シュ...

MetaHuman の効果は素晴らしいです!しかし、メタバースだけを考えると、パターンは少し小さくなります。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Java プログラミング スキル - データ構造とアルゴリズム「バイナリ ソート ツリー」

[[390181]]基本的な紹介バイナリ ソート (検索) ツリー: バイナリ ソート ツリー内の...

...

...

大手銀行はなぜ従業員にプログラミングの学習を求めるのでしょうか?あなたもその一人かもしれません

[51CTO.com 速訳] 海外の主要メディアであるフィナンシャル・タイムズとウォール・ストリート...

...

競争が激化する中、ドローン配達の時代はいつ来るのでしょうか?

現在、電子商取引の発展が継続的に加速する中、物流と配送のプレッシャーは高まり続けており、ドローンは業...

ディープラーニング入門

2016年、Googleの人工知能プログラムAlphaGoが世界的囲碁プレイヤーのイ・セドルと対戦し...

人工知能:ニューノーマルにおける成長促進要因

SHRMのレポートによると、中小企業経営者の43%がパンデミック中に事業を生き残るための新たな方法を...

...

ガートナー:2025年までにベンチャーキャピタル投資の75%がAIを活用して意思決定を行うようになる

海外メディアの報道によると、市場調査会社ガートナーは最近、投資家が人工知能やデータ分析技術をますます...

...