この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 機械学習プロジェクトに取り組んでいる人は皆、この苦痛を抱えているようです。つまり、学術ウェブサイトや GitHub から適切なデータセットを見つけることです。 しかし今では、AI 開発を容易にするのに役立つ Web サイトがあります。 このプロジェクトは BIFROST と呼ばれ、合計1,899 個の画像データセットを含み、人間、地理空間、自動運転車などの特別な分類を持つデータセット検索ツールです。 ワンクリック検索、無料アクセス、元のデータベースへの直接リンクにより、適切なデータセットをすばやく見つけることができます。研究チームはシンガポール出身で、Redditでの人気は17時間で200を超えました。 説明書早速、このウェブサイトにアクセスして試してみましょう〜 ご覧のとおり、このツールはタスク、アプリケーション、カテゴリ、タグ、または形式別に分類されています。 このウェブサイトは、「カテゴリー」別に、人間、地理空間、自動運転車、小売、3D など 18 のカテゴリーに分かれています。 左にスワイプして必要なカテゴリを選択すると、ワンクリックで結果を取得できます。3Dを例に挙げると、次のようなページが表示されます。 「Humans」を例にとると、インターフェースは次のようになります。 また、注目順に並べられていることもわかります。さらに、「最新」、「ラベル数最多」、「データセット サイズ」、「画像数最多」などのカテゴリを選択することもできます。 「クイック検索」に加えて、開発者の特定のニーズに応じて検索することもできます。 タスク タイプ、ラベル形式、画像の最小数などの「制約」を選択できます。 タスクの種類には、主に画像セグメンテーション、ターゲット検出、画像分類、ポーズ推定、視覚的推論、3D 再構築、ビデオ分類が含まれます。 ラベル形式には、YOLO、PASCAL、COCO、セグメンテーションなどがあります。 データセットオブジェクトの検出、画像のセグメンテーション、キャプション作成に適した大規模なデータセットである COCO を例に挙げてみましょう。 インターフェースは次のとおりです。 主に、画像例、データセットの紹介、特徴、カテゴリ分布の 4 つのセクションに分かれています。 導入部では、このデータセットの研究チームや一文の紹介、CC4.0 プロトコルを通過する部分、さらに元のデータベースへの直接リンクや論文アドレスを確認できます。 CC4.0 プロトコルは、他の人が作品を配布することを許可するパブリック著作権ライセンスである Creative Commons ライセンスです。同様のライセンスとして、MIT プロトコルもあります。 今回著者らが選択した約 2,000 のデータ セットは、これら 2 つのプロトコルを通過しました。したがって、Web サイトはこれらのデータ セットを直接管理するのではなく、これらのデータ セットの「ポーター」にすぎません。 「カテゴリー分布」セクションでは、まずラベルが付いていない画像やラベルが多すぎる画像の数が表示されます。 次に、異なるラベル カテゴリに応じて、画像数の分布が表示されます。 このプロジェクトの責任者はシンガポール出身で、現在はBifrostのCEOを務めるCharles Wong氏です。 彼はシンガポール工科デザイン大学で学士課程を修了し、MITグローバルリーダーシッププログラムに参加しました。 次に、彼らの仕事は以下の側面に焦点を当てます。
「なぜ当社のデータが優れているのか?」 ウェブサイトでも紹介されているように、適切な画像データセットを高い精度と正確さで素早く見つけることができます。 ご興味がございましたら、下のリンクをクリックしてお試しください。 ウェブサイトアドレス: https://datasets.bifrost.ai/ |
<<: AIが光子の時間を3D画像に変換し、時間の経過による世界を視覚化する
過去 10 年間、データ サイエンスと機械学習の分野では驚異的な進歩が見られました。ディープラーニン...
PHP を学習しているときに、PHP のソート問題に遭遇することがあります。ここでは、PHP のソー...
Siri に道順を尋ねるたびに、複雑なコード列がアクティブ化され、「Siri」は質問を理解し、必要...
今日のインターネット アプリケーション開発では、可用性の高い分散システムを構築することが、システムの...
多くの小売業者にとって、2020年のコロナウイルスの流行は、その存続と運営に深刻な影響を及ぼしました...
機械学習は、自動化と異常な動作の検出を通じて、よりスケーラブルかつ効率的に IoT デバイスを保護す...
この記事は次のように構成されています。固有表現抽出 (NER) とはどのように識別しますか? cs2...
基本概念決定木は分類アルゴリズムです。データ型: 数値と名目値。構築アルゴリズムは名目データに対して...
著者 | 崔昊レビュー | Chonglou一般的なモデルは優れていますが、技術者は、独自の大規模な...
6月14日のニュース:最近、人工知能の新興企業OpenAIとMicrosoftが人工知能の分野で協力...
10月11日、アリババは2017年杭州雲奇大会で、人類のテクノロジーの未来を探求する実験室「大墨学院...
最近、静かに梅雨の季節が去り、猛烈な台風の季節が勢いよくやって来ています。 [[336317]] 8...