無料の機械学習ベンチマークツール:主要なデータセットを統合し、GitHubに接続して使用する

無料の機械学習ベンチマークツール:主要なデータセットを統合し、GitHubに接続して使用する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習に携わっている友人は、必然的にさまざまなデータセットで AI モデルを実行する必要があります。

現在、 Papers with Codeチームは、すべてのオープンソース モデルを実行することを目的としたsotabenchと呼ばれる自動ベンチマーク サービスを開始しました。

これを使用すると、コードをアップロードする必要はなく、GitHub プロジェクトに接続するだけで、クラウド GPU がスコアの実行を支援します。新しいコミットが送信されるたびに、システムが自動的にスコアを更新します。様々な強豪選手の活躍が見られる世界ランキングリストもございます。

主要な主流データセットのサポートに加えて、ユーザーが独自のデータセットをアップロードすることもサポートします。

他の人の論文の結果が信頼できるかどうかも調べることができます。

たとえば、Facebook の FixRes プロジェクトをフォークし、評価ファイルを設定します。

次に、ワンクリックで接続し、Sotabench の GPU で ImageNet 画像分類テストを実行します。

次のような結果が得られます。

トップ 1 の精度、トップ 5 の精度、論文の結果との差 (注を参照)、実行速度、世界ランキングなどがすべて明確に表示されます。

注: ε-REPR の場合、結果と論文結果の差が 0.3% 以内であればチェックマークが表示されます。差が 0.3% 以上で論文結果より悪い場合は赤い十字が表示されます。結果が論文結果より優れている場合はチェックマーク + が表示されます。

この無料のベンチマーク ツールは、リリースから 1 日以内に大好評を博し、Twitter で 600 件以上の「いいね!」、Reddit で 270 件以上のヒットを獲得しました。

ネットユーザーはこう言った: これは開発者コミュニティにとって非常に役立ちます!

それでは、sotabenchの機能と使い方を見てみましょう。

使い方は簡単、すべてに対応

チームによれば、 SotabenchPapers with Codeの双子の姉妹であるとのこと。

紙のレポートのスコアを継続的に監視する Papers with Code は誰もがよく知っています。高得点モデルに対応するコードを見つけるために使用でき、人類に利益をもたらすツールです。

それを補完するものとして、SotaBench はオープンソース プロジェクトとコードの実際の実行結果を観察します。自分のモデルをテストし、他の人のモデルを検証して、論文で言われているほど強力かどうかを確認できます。

他のモデルとの比較をサポートし、速度と精度のトレードオフを表示できます。

では、sotabench はどのように使うのでしょうか?簡単、たった2ステップ。

最初のステップは、モデルをローカルで評価することです。

GitHub プロジェクトのルート ディレクトリに、sotabench.py​​ ファイルを作成します。データセットを読み込んで処理し、そこから予測を導き出すために必要なロジックを含めることができます。このファイルはコミットごとに実行されます。次に、オープンソースのベンチマーク ライブラリを使用してモデルを実行します。このライブラリは、フレームワークに依存せず、ImageNet などのデータセットを含む sotabench-eval にすることができます。また、PyTorch データセット ローダーで使いやすい PyTorch ライブラリである torchbench にすることもできます。

正常に実行されたら、次の手順に進むことができます。

2 番目のステップは GitHub プロジェクトに接続することです。sotabench が以下の実行をお手伝いします。

このボタンをクリックすると、GitHub アカウントに接続し、さまざまなプロジェクトが表示されます。接続をテストするプロジェクトを選択します。接続後、システムはマスターを自動的にテストし、公式結果を記録します。すべてはクラウド GPU 上で実行されます。テスト環境は requirements.txt ファイルに基づいて設定されているため、このファイルをリポジトリに追加して、システムが使用する依存関係をキャプチャできるようにします。

今後は、コミットを送信するたびに、システムがスコアを再実行し、スコアが最新であり、更新されたモデルが引き続き機能していることを確認します。

この方法では、モデルにバグがある場合、それをすぐに知ることができます。

[[278983]]

他の人のモデルを実行したい場合は、自分のモデルにフォークするだけです。

現在、sotabench はすでにいくつかの主流のデータ セットをサポートしています。

リストはまだ更新中であり、チームはベンチマーク ファミリーを充実させるために、あらゆる分野のヒーローを心から招待しています。

新しいベンチマークの作成と、既存のベンチマークへの新しい実装の追加の両方をサポートします。

sotabench-eval または torchbench プロジェクトに PR を送信するか、新しい Python パッケージを直接作成することができます。

準備ができたら、sotabench フォーラムに新しいトピックを投稿すると、チームがベンチマークを追加します。

絶賛のレビュー

このサービスが開始されると、ネットユーザーたちはこのサービスに賛同し、Twitter で 600 件を超える「いいね!」を獲得するなど、絶賛のレビューを寄せました。

一部のネットユーザーはこう言った。

素晴らしい!初心者にとっては、データセットの取得、前処理、評価の自動化と標準化が役立ちます。さまざまなモデルとそのハイパーパラメータの結果を分析してこれらのモデルを評価することは、それ自体が難しい作業であり、さまざまな論文の大量の非構造化データを調べる必要があります。これにより、問題ははるかに簡単になります。 (部分翻訳)

多くのネットユーザーがこのプロジェクトについて友好的な議論や提案を行っており、開発者もオンラインで好意的に反応しています。

たとえば、このネットユーザーは次のように提案しています: モデルのハイパーパラメータは、送信されるたびに報告できますか?

著者はすぐにこう答えました。「偉大な心は同じように考える。」次のアップデートで追加します!

さらに、将来のアップデートでは、ユーザーが生成モデルのトレーニングパラメータへのリンクを追加できるようにすることを検討しています。

ポータル

sotabench公式サイト:

https://sotabench.com/

ベンチマークライブラリの汎用バージョン:

https://github.com/paperswithcode/sotabench-eval

ベンチマークライブラリ PyTorch バージョン:

https://github.com/paperswithcode/torchbench

<<:  人工知能への恐怖とその対処法5つ

>>:  AdobeなどがAIを活用しアニメキャラクターのポーズ移行を実現する新タイプの「パペットアニメーション」を提案

ブログ    

推薦する

機械学習エンジニアとデータサイエンティストの違い

今日では、データ サイエンティストの仕事は非常に一般的になり、機械学習もその中に完全に含まれる可能性...

人工知能の急速な発展により、どのようなビジネス分野に浸透しているのでしょうか?テレマーケティングの将来はどうなるのでしょうか?

最近、人工知能の開発はますます激しくなってきています。ますます多くの新製品が私たちの生活に入ってきて...

数千億ドル規模の市場:教育用ロボットは本当に実現可能か?

[[341606]]ある調査では、2025年までに中国の教育用ロボット市場は3000億ドルに達し、...

人工知能の新時代が近づいています。従来の産業の従事者はどこへ向かうのでしょうか?

世間の好むと好まざるとにかかわらず、人工知能の新しい時代が静かに到来した。しかし、人工知能が本格的に...

この目立たないロボットトラックにユニコーンが登場しました!

人工知能やビッグデータなどの技術の発展に伴い、チャットボットも大きな進歩を遂げています。その応用分野...

「顔認識」時代の準備はできていますか?

[51CTO.comからのオリジナル記事] 近年、生体認証技術はますます成熟し、私たちの生活の中に...

AI企業は米国政府に安全性テストを報告することが義務付けられる

バイデン政権は、すべての主要なAIシステムの開発者にセキュリティテストの結果を政府に開示することを義...

検出器を追加して、YOLOv8 を実際の戦闘に展開しましょう!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

精密人工知能:原子核物理学と素粒子物理学における新たな力

素粒子物理学の標準モデルは、既知のすべての素粒子と、宇宙を支配する 4 つの基本的な力のうち 3 つ...

...

...

HellobikeがAIベースのシェアモビリティ技術を発表

Hello Mobilityの非電動車両安全管理システム持続可能な交通の専門企業Hellobikeは...

自動運転の研究の方向性は間違っているのか?

1 知覚ソリューション: 純粋な視覚とマルチセンサー融合自動車が自動運転を実現するには、まず周囲を...