この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)から転載したものです。 コンピューター ビジョンにより、コンピューターは画像やビデオの内容を理解できるようになり、人間の視覚システムと同じようにタスクを自動的に完了できるようになります。コンピューター ビジョンのタスクには、画像の取得、処理、分析が含まれます。画像データには、ビデオシーケンス、マルチカメラ画像、医療用スキャナーからの多次元データなど、さまざまな形式があります。この記事では、機械学習のトレーニングに適したデータセットをいくつか紹介します。
(1)Labelme:MITコンピュータ科学・人工知能研究所(CSAIL)が共同で作成した大規模なデータセット。187,240枚の画像、62,197枚の注釈付き画像、658,992個のラベル付きオブジェクトが含まれています。 (2)ImageNet:新しいアルゴリズムのための現実世界の画像データセット。WordNet階層に従って編成されており、階層内の各ノードは数百または数千の画像で記述されています。 (3)LSUN:シーン理解、多くの補助タスク(部屋のレイアウト推定、顕著性予測など) (4)MS COCO:COCOは、20万枚以上のラベル付き画像を含む大規模な物体検出、セグメンテーション、キャプション作成データセットです。オブジェクトのセグメンテーション、コンテキストの認識などに使用できます。 (5)コロンビア大学画像ライブラリ:COIL100データセットには、360°で撮影された100種類のオブジェクトが含まれています。 (6)ビジュアルゲノム:構造化された画像概念と言語を結び付けることを目的としたデータセットおよび知識ベースです。このデータセットは、108,077 個の画像キャプションを含む詳細な視覚知識ベースです。 (7)レゴブロック:16種類のレゴブロックの画像約12,700枚がフォルダに整理され、Blenderを使用してコンピュータレンダリングされています。 (8)Google Open Images:クリエイティブ・コモンズで利用可能な、「6,000以上のカテゴリにわたるラベルが付けられた」900万枚の画像のURL。 (9)Youtube-8M:数百万のYouTube動画IDから構成される大規模なラベル付きデータセットで、3,800以上の視覚的エンティティの注釈が含まれています。 (10)Labelled Faces in the Wild:顔認識関連のアプリケーションの開発を目的とした、ラベル付けされた顔画像13,000枚が含まれています。 (11)スタンフォード犬のデータセット:20,580枚の画像と120種類の犬種が含まれており、カテゴリごとに約150枚の画像があります。 (12)場所:205のシーンカテゴリーとカテゴリーラベル付きの250万枚の画像を含むシーンベースのデータベース。 (13)CelebFaces:20万枚以上の有名人の画像が収録された顔データセット。各画像には40個の属性が付与されている。 (14)花:英国でよく見られる花の画像のデータセット。102の異なるカテゴリで構成されています。各花のカテゴリーは、さまざまなポーズと照明のバリエーションを持つ 40 ~ 258 枚の画像で構成されています。 (15)植物画像解析:100万枚以上の植物画像を収録したデータセットのコレクション。 11種類の植物からお選びいただけます。 (16)家庭内オブジェクト:主にキッチン、バスルーム、リビングルームからの家庭内のランダムなオブジェクトを含むデータセット。トレーニングデータセットとテストデータセットに分かれています。 (17)CIFAR-10:10のカテゴリーに分けられた60,000枚の32×32カラー画像からなる大規模な画像データセット。データセットは 5 つのトレーニング バッチと 1 つのテスト バッチに分かれており、各バッチには 10,000 枚の画像が含まれています。 (18)CompCars:163の自動車ブランドと1,716のモデルが含まれています。各モデルには、最高速度、排気量、ドアの数、座席数、車種の5つの属性が付けられています。 (19)屋内シーン認識データセット:これは非常にユニークなデータセットです。ほとんどのシーン認識モデルは屋外でより優れたパフォーマンスを発揮するため、このデータセットは役立ちます。 67 の屋内カテゴリと合計 15,620 枚の画像が含まれています。 (20)VisualQA:VQAデータセットには、265,016枚の画像に関する自由回答形式の質問が含まれています。これらの質問には、視覚的理解と言語的理解の両方が必要です。各画像には少なくとも 3 つの質問があり、各質問には少なくとも 10 の回答があります。 |
<<: 「人工知能+学習」は教育をより良くするのでしょうか?
2017年5月に世界保健機関が発表したデータによると、世界中で毎年約125万人が交通事故で亡くなって...
人工知能はもはや企業にとって選択肢ではありません。すぐに、それも差別化要因ではなくなるでしょう。ビジ...
量子コンピューティングの継続的な進歩により、コンピュータ能力の大幅な向上がネットワーク セキュリティ...
[[274634]] 2019 年の秋が近づき、最初の 2 四半期が終了しようとしている今、今年前半...
合成現実(1)課題人工知能は、人々がこれまでしたことのない、または言ったことのないことをしたり、した...
[[221404]] 3月3日午後9時30分、全国人民代表大会の代表でテンセント会長の馬化騰氏が黒...
今日の紹介を始める前に、次のシナリオを見てみましょう。 上記のアニメーションは、複数の写真からレンダ...
アジアのビッグデータおよび人工知能企業である凌創志信は、同社の伝統的なリテイン事業であるデータラベリ...
ハイテク業界は常に進化しており、毎週新たな革命的な変化が起こっています。当然のことながら、関連するニ...
ネオは、自分が住んでいる世界が現実ではなく、綿密に設計されたシミュレーションであることを発見します。...
[[254738]]文部科学省が公表した2017年度版の高等学校総合学習の計画と14項目の学習指導...
チャットボットの無限ループや同じ質問の繰り返しにイライラしていませんか? これは顧客にとってよくある...
写真トークン、ベクトル、埋め込み、アテンション、これらの AI モデル用語は、いつも馴染みがありそう...