ついに！この強力な「オープンソース画像認識システム」がオンラインになりました!

[[407147]]

画像認識といえば、皆さんすでによくご存知だと思います。この技術は、顔認証、決済、出勤記録、ホテルチェックイン、カメラによる違法運転の識別、セレブの商品をオンラインで購入する際の画像検索、自動運転車の運転支援、医療画像の補助診断、画像や動画の分析、編集、再現など、私たちの生活のあらゆる側面に深く組み込まれてきました。

これらはすべて画像分類とターゲット検出のアプリケーションではないのかと疑問に思う人もいるかもしれません。しかし、その背後にはさらに多くのものがあり、メトリック学習や画像検索もあり、現在ではさまざまな機能を統合した[ユニバーサル画像認識システム]もあり、1つのシステムであらゆる分野のソリューションを簡単に手に入れることができ、上記のアプリケーションシナリオをカバーしています。

急いでStarで節約しましょう:

https://github.com/PaddlePaddle/PaddleClas

では、このプロジェクトの何が特別なのでしょうか? 画像認識は、画像分類や物体検出よりもどう優れているのでしょうか?

[製品認識]を例に挙げてみましょう。簡単な画像分類と物体検出を使用すると、次のことがわかります。

製品カテゴリは数万種類あり、すべてのカテゴリを事前にトレーニングセットに入れることは不可能です。トレーニングセットが不完全な場合、アルゴリズムをトレーニングするにはどうすればよいですか?

サンプルカテゴリは非常に不均衡です。各カテゴリの製品数は不均等に分散されており、一部のカテゴリには写真が 1 枚または 2 枚しかありません。このようなカテゴリをアルゴリズムでトレーニングしたとしても、認識精度は依然として非常に低くなります。

製品カテゴリは非常に速く更新されます。さまざまな販売者が常に新しいカテゴリを立ち上げており、新しい製品が追加されるたびに、モデルを多大な労力で再トレーニングする必要があります。

画像認識を使用すると、上記の問題を完全に解決できるだけではありません。すぐに始められて、理解しやすいです。識別するオブジェクトの画像を準備したら、複数のカテゴリ、小さなサンプル、データの不均衡の問題を解決するのに必要なのは 3 つのステップだけです。商品認識だけでなく、車両、顔、ロゴ、歩行者も認識可能！！！識別したいものを何でも識別しましょう！（自由を感じる！）

さらに、この画像認識システムの 4 つのコアコンポーネントはすべて慎重に磨き上げられています。単独で使用しても、連続して使用しても、驚くべき効果があります。

被写体検出: 高精度かつ超軽量の PP-YOLOv2 検出アルゴリズムを使用して、画像の被写体を素早く検出し、認識効率を向上させます。

バックボーンネットワーク: 最も洗練されたモバイルモデルと高精度のサーバーモデルをカバーする 6 シリーズのバックボーンを選択し、さまざまな使用シナリオのニーズに合わせて構造を迅速に変更できるようにします。

メトリック学習: ArcMargin、CenterLoss、TriHard などの業界最先端のメトリック学習手法を統合し、任意に組み合わせて堅牢な画像機能を簡単にトレーニングできます。

検索システム: Baidu が独自に開発した Möbius アルゴリズムを統合し、ベクトル検索を効率的に完了し、検索ライブラリをいつでも更新できるため、一度のトレーニングで長期使用が可能になります。

開発者は、これら 4 つのモジュールを個別に使用したり、独立して組み立てたりできるだけでなく、車両認識、ロゴ認識、製品認識、アニメーション認識の 4 つの構築されたシステムを直接採用することもできます。検索ライブラリを追加するだけで、すぐに制作を開始できます。

このような強力で思慮深いプロジェクト、何を待っていますか? ！急いで🌟スター🌟をコレクションに追加して参加しましょう！

ポータル:

https://github.com/PaddlePaddle/PaddleClas

クイック体験:

https://github.com/PaddlePaddle/PaddleClas/blob/release%2F2.2/docs/zh_CN/tutorials/quick_start_recognition.md

<<: AI は教育にどのように役立つのでしょうか?

>>: NVIDIA が Canvas を発表: AI を活用してシンプルな筆遣いをフォトリアリスティックな風景画に変換

ブログ

ついに！この強力な「オープンソース画像認識システム」がオンラインになりました!

生成 AI とデータ品質は共存できますか?

自動車学校がロボットコーチカーを導入：全行程を通じて優しい音声ガイド、コーチに怒鳴られる必要はもうない

インスパー・シャオ・シュエ：人工知能はモノのインターネットを「スマート」にする

最短経路問題の探究: ダイクストラのアルゴリズム

2030年「メタバース」就職ガイド！ CSは依然として非常に人気があり、博士号取得者の需要は衰えていません。

推薦する

ヘルスケアにおける6つの新たなテクノロジートレンド

気候変動と闘うためのAIの8つのガイドライン

人工知能とビッグデータが心理学の分野に参入

AI はあなたの仕事を奪うだけでなく、もっと恐ろしい脅威をもたらす可能性があります...

ボストン・ダイナミクスの工場で働くロボット犬が話題に

NYU のポスドクが、arXiv に 30 分遅れて論文を提出したというだけで ACL に拒否されたのですか?学者たちは憤慨し、ACLに二度と投票しないと誓う

清華大学張北院士：融合乗算による第三世代人工知能の三空間融合モデルの解釈

次世代の人工知能は将来のテクノロジーの展望を一変させるだろう