ついに!この強力な「オープンソース画像認識システム」がオンラインになりました!

ついに!この強力な「オープンソース画像認識システム」がオンラインになりました!

  [[407147]]

画像認識といえば、皆さんすでによくご存知だと思います。この技術は、顔認証、決済、出勤記録、ホテルチェックイン、カメラによる違法運転の識別、セレブの商品をオンラインで購入する際の画像検索、自動運転車の運転支援、医療画像の補助診断、画像や動画の分析、編集、再現など、私たちの生活のあらゆる側面に深く組み込まれてきました。

これらはすべて画像分類とターゲット検出のアプリケーションではないのかと疑問に思う人もいるかもしれません。しかし、その背後にはさらに多くのものがあり、メトリック学習や画像検索もあり、現在ではさまざまな機能を統合した[ユニバーサル画像認識システム]もあり、1つのシステムであらゆる分野のソリューションを簡単に手に入れることができ、上記のアプリケーションシナリオをカバーしています。

急いでStarで節約しましょう:

https://github.com/PaddlePaddle/PaddleClas

では、このプロジェクトの何が特別なのでしょうか? 画像認識は、画像分類や物体検出よりもどう優れているのでしょうか?

[製品認識]を例に挙げてみましょう。簡単な画像分類と物体検出を使用すると、次のことがわかります。

製品カテゴリは数万種類あり、すべてのカテゴリを事前にトレーニング セットに入れることは不可能です。トレーニング セットが不完全な場合、アルゴリズムをトレーニングするにはどうすればよいですか?

サンプル カテゴリは非常に不均衡です。各カテゴリの製品数は不均等に分散されており、一部のカテゴリには写真が 1 枚または 2 枚しかありません。このようなカテゴリをアルゴリズムでトレーニングしたとしても、認識精度は依然として非常に低くなります。

製品カテゴリは非常に速く更新されます。さまざまな販売者が常に新しいカテゴリを立ち上げており、新しい製品が追加されるたびに、モデルを多大な労力で再トレーニングする必要があります。

画像認識を使用すると、上記の問題を完全に解決できるだけではありません。すぐに始められて、理解しやすいです。識別するオブジェクトの画像を準備したら、複数のカテゴリ、小さなサンプル、データの不均衡の問題を解決するのに必要なのは 3 つのステップだけです。商品認識だけでなく、車両、顔、ロゴ、歩行者も認識可能! ! !識別したいものを何でも識別しましょう! (自由を感じる!)

さらに、この画像認識システムの 4 つのコア コンポーネントはすべて慎重に磨き上げられています。単独で使用しても、連続して使用しても、驚くべき効果があります。

被写体検出: 高精度かつ超軽量の PP-YOLOv2 検出アルゴリズムを使用して、画像の被写体を素早く検出し、認識効率を向上させます。

バックボーン ネットワーク: 最も洗練されたモバイル モデルと高精度のサーバー モデルをカバーする 6 シリーズのバックボーンを選択し、さまざまな使用シナリオのニーズに合わせて構造を迅速に変更できるようにします。

メトリック学習: ArcMargin、CenterLoss、TriHard などの業界最先端のメトリック学習手法を統合し、任意に組み合わせて堅牢な画像機能を簡単にトレーニングできます。

検索システム: Baidu が独自に開発した Möbius アルゴリズムを統合し、ベクトル検索を効率的に完了し、検索ライブラリをいつでも更新できるため、一度のトレーニングで長期使用が可能になります。

開発者は、これら 4 つのモジュールを個別に使用したり、独立して組み立てたりできるだけでなく、車両認識、ロゴ認識、製品認識、アニメーション認識の 4 つの構築されたシステムを直接採用することもできます。検索ライブラリを追加するだけで、すぐに制作を開始できます。

このような強力で思慮深いプロジェクト、何を待っていますか? !急いで🌟スター🌟をコレクションに追加して参加しましょう!

ポータル:

https://github.com/PaddlePaddle/PaddleClas

クイック体験:

https://github.com/PaddlePaddle/PaddleClas/blob/release%2F2.2/docs/zh_CN/tutorials/quick_start_recognition.md

<<:  AI は教育にどのように役立つのでしょうか?

>>:  NVIDIA が Canvas を発表: AI を活用してシンプルな筆遣いをフォトリアリスティックな風景画に変換

ブログ    

推薦する

百度の女性デーのポスターはスマートライフの姿を描いている:人工知能は女性をより自由にする

社会の進歩と国民の意識の高まりに伴い、社会全体が女性の権利にますます注目するようになっています。 3...

...

ナレッジグラフの紹介

1.1 ナレッジグラフの開発履歴ナレッジグラフは 1950 年代に始まり、大きく 3 つの開発段階に...

ハーバード大学の研究者がAIを活用して世界中の密猟を阻止

ハーバード大学ジョン・A・ポールソン工学応用科学大学院のリリー・シューさんは、幼いころから環境と保護...

1万語に及ぶ長い記事です!ディープマインドの科学者が2021年の高エネルギー研究15件をまとめる

2021 年には、より強力なコンピューティング能力、データ、モデルの助けを借りて、機械学習と自然言語...

ブロックチェーン技術における機械学習

近代化は世界を変える可能性のある新しい画期的なものをもたらしました。現実世界の問題は、単純な従来のア...

実践的な知識 | 教師なし学習の基礎に関する包括的な理解

1. 教師なし学習教師なし学習の特徴は、モデルが学習するデータにラベルがないことです。そのため、教師...

ユーザーの旅行需要予測

1. 背景と課題1. 背景Fliggy アプリ、Alipay、Taobao では、航空券、鉄道チケッ...

中国の人工知能特許ランキングで、百度、テンセント、マイクロソフト、インスパーが上位4社にランクイン

12月2日、国家工業情報セキュリティ発展研究センターは「中国人工知能特許技術分析報告書」を発表し、百...

JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実...

インドは天気予報の精度を向上させ、異常気象に対処するためにAIをテストしている

ロイター通信は現地時間12月24日、インドが天気予報の精度向上のため、気候モデルの構築にAIの使用を...

適切な AI ユースケースを選択するための 5 つのヒント

多くの企業はまだ AI を導入する準備ができていない可能性があるため、まずは 1 つのプロジェクトか...

NTUは、3枚の画像のみを使用して高品質の3Dシーンを合成するSparseNeRFを提案しています。

ディープラーニングと 3D テクノロジーの発展により、Neural Radiance Fields ...

...

医療ロボットが登場し、医療分野は大きな変化を迎える

近年、人工知能の発展、技術の飛躍的進歩、その応用分野の漸進的な拡大に伴い、人々の生活と福祉の重要な一...