無料の機械学習ベンチマークツール:主要なデータセットを統合し、GitHubに接続して使用する

無料の機械学習ベンチマークツール:主要なデータセットを統合し、GitHubに接続して使用する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習に携わっている友人は、必然的にさまざまなデータセットで AI モデルを実行する必要があります。

現在、 Papers with Codeチームは、すべてのオープンソース モデルを実行することを目的としたsotabenchと呼ばれる自動ベンチマーク サービスを開始しました。

これを使用すると、コードをアップロードする必要はなく、GitHub プロジェクトに接続するだけで、クラウド GPU がスコアの実行を支援します。新しいコミットが送信されるたびに、システムが自動的にスコアを更新します。様々な強豪選手の活躍が見られる世界ランキングリストもございます。

主要な主流データセットのサポートに加えて、ユーザーが独自のデータセットをアップロードすることもサポートします。

他の人の論文の結果が信頼できるかどうかも調べることができます。

たとえば、Facebook の FixRes プロジェクトをフォークし、評価ファイルを設定します。

次に、ワンクリックで接続し、Sotabench の GPU で ImageNet 画像分類テストを実行します。

次のような結果が得られます。

トップ 1 の精度、トップ 5 の精度、論文の結果との差 (注を参照)、実行速度、世界ランキングなどがすべて明確に表示されます。

注: ε-REPR の場合、結果と論文結果の差が 0.3% 以内であればチェックマークが表示されます。差が 0.3% 以上で論文結果より悪い場合は赤い十字が表示されます。結果が論文結果より優れている場合はチェックマーク + が表示されます。

この無料のベンチマーク ツールは、リリースから 1 日以内に大好評を博し、Twitter で 600 件以上の「いいね!」、Reddit で 270 件以上のヒットを獲得しました。

ネットユーザーはこう言った: これは開発者コミュニティにとって非常に役立ちます!

それでは、sotabenchの機能と使い方を見てみましょう。

使い方は簡単、すべてに対応

チームによれば、 SotabenchPapers with Codeの双子の姉妹であるとのこと。

紙のレポートのスコアを継続的に監視する Papers with Code は誰もがよく知っています。高得点モデルに対応するコードを見つけるために使用でき、人類に利益をもたらすツールです。

それを補完するものとして、SotaBench はオープンソース プロジェクトとコードの実際の実行結果を観察します。自分のモデルをテストし、他の人のモデルを検証して、論文で言われているほど強力かどうかを確認できます。

他のモデルとの比較をサポートし、速度と精度のトレードオフを表示できます。

では、sotabench はどのように使うのでしょうか?簡単、たった2ステップ。

最初のステップは、モデルをローカルで評価することです。

GitHub プロジェクトのルート ディレクトリに、sotabench.py​​ ファイルを作成します。データセットを読み込んで処理し、そこから予測を導き出すために必要なロジックを含めることができます。このファイルはコミットごとに実行されます。次に、オープンソースのベンチマーク ライブラリを使用してモデルを実行します。このライブラリは、フレームワークに依存せず、ImageNet などのデータセットを含む sotabench-eval にすることができます。また、PyTorch データセット ローダーで使いやすい PyTorch ライブラリである torchbench にすることもできます。

正常に実行されたら、次の手順に進むことができます。

2 番目のステップは GitHub プロジェクトに接続することです。sotabench が以下の実行をお手伝いします。

このボタンをクリックすると、GitHub アカウントに接続し、さまざまなプロジェクトが表示されます。接続をテストするプロジェクトを選択します。接続後、システムはマスターを自動的にテストし、公式結果を記録します。すべてはクラウド GPU 上で実行されます。テスト環境は requirements.txt ファイルに基づいて設定されているため、このファイルをリポジトリに追加して、システムが使用する依存関係をキャプチャできるようにします。

今後は、コミットを送信するたびに、システムがスコアを再実行し、スコアが最新であり、更新されたモデルが引き続き機能していることを確認します。

この方法では、モデルにバグがある場合、それをすぐに知ることができます。

[[278983]]

他の人のモデルを実行したい場合は、自分のモデルにフォークするだけです。

現在、sotabench はすでにいくつかの主流のデータ セットをサポートしています。

リストはまだ更新中であり、チームはベンチマーク ファミリーを充実させるために、あらゆる分野のヒーローを心から招待しています。

新しいベンチマークの作成と、既存のベンチマークへの新しい実装の追加の両方をサポートします。

sotabench-eval または torchbench プロジェクトに PR を送信するか、新しい Python パッケージを直接作成することができます。

準備ができたら、sotabench フォーラムに新しいトピックを投稿すると、チームがベンチマークを追加します。

絶賛のレビュー

このサービスが開始されると、ネットユーザーたちはこのサービスに賛同し、Twitter で 600 件を超える「いいね!」を獲得するなど、絶賛のレビューを寄せました。

一部のネットユーザーはこう言った。

素晴らしい!初心者にとっては、データセットの取得、前処理、評価の自動化と標準化が役立ちます。さまざまなモデルとそのハイパーパラメータの結果を分析してこれらのモデルを評価することは、それ自体が難しい作業であり、さまざまな論文の大量の非構造化データを調べる必要があります。これにより、問題ははるかに簡単になります。 (部分翻訳)

多くのネットユーザーがこのプロジェクトについて友好的な議論や提案を行っており、開発者もオンラインで好意的に反応しています。

たとえば、このネットユーザーは次のように提案しています: モデルのハイパーパラメータは、送信されるたびに報告できますか?

著者はすぐにこう答えました。「偉大な心は同じように考える。」次のアップデートで追加します!

さらに、将来のアップデートでは、ユーザーが生成モデルのトレーニングパラメータへのリンクを追加できるようにすることを検討しています。

ポータル

sotabench公式サイト:

https://sotabench.com/

ベンチマークライブラリの汎用バージョン:

https://github.com/paperswithcode/sotabench-eval

ベンチマークライブラリ PyTorch バージョン:

https://github.com/paperswithcode/torchbench

<<:  人工知能への恐怖とその対処法5つ

>>:  AdobeなどがAIを活用しアニメキャラクターのポーズ移行を実現する新タイプの「パペットアニメーション」を提案

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

2024 年の産業用ロボットのトップ 10 のトレンドとイノベーション

産業用ロボットの世界では、イノベーションのペースが加速し続けており、毎年、製造、自動化、作業の方法を...

ドバイ、街頭にロボット警察を配備へ

ロシア・トゥデイTVのウェブサイトは20日、UAE当局者の発言を引用し、UAE初のロボット警察が今年...

コンピュータビジョンがビジネス課題の解決に役立つ 5 つの方法

自動運転車、交通標識検出、顔認識、セルフサービスチェックアウト。 これらすべての高度なソリューション...

ビッグデータと人工知能の違いすら分からないのに、あなたはまだトップへの道を歩んでいる

ビッグデータと AI は公平に比較​​できるでしょうか? ある程度は公平ですが、まずはその違いを明確...

...

米国の3つの事例を踏まえた、医療AIの正しい導入アプローチとは?

[[287239]]先ほど終了したRSNAでは、国内外のAI企業が製品と科学研究の両面で再び世界の...

...

会話型AIとその技術コンポーネントの機能を探る

今日では、自動化、人工知能 (AI)、自然言語処理 (NLP) の進歩により、コスト効率の高いデジタ...

アプリケーションプロトコル識別における大規模言語モデルの応用

パート 01.アプリケーション プロトコル識別とは何ですか?アプリケーション プロトコル識別とは、ネ...

AIシナリオの実装を加速させる2019年北京人工知能産業サミットフォーラムが北京で成功裏に開催されました

2019年6月28日、北京で2019年北京人工知能産業サミットフォーラムが開催されました。主催は工業...

ビッグデータは私たちを新たな AI の冬に引きずり込むのか?

過去数年間の息を呑むようなニュースクリップの数は思い出すのが難しいが、人工知能の歴史は挫折と挫折に満...

2つのAIデートがネットワーク全体の注目を集めました。アルゴリズムがどれだけ強力であっても、失敗は免れません

この世界では、AI チャットボットを扱ったことがある人は、いつかは自分の言葉によって大人としての尊厳...

ソフトマックスボトルネックを超えて: 高ランク RNN 言語モデル

因数分解に基づいて、リカレントニューラルネットワーク (RNN) に基づく言語モデルは、複数のベンチ...

本記事では、2019年の産業用ロボット開発業界の現状を解説します!

[[323393]]国際ロボット連盟(IFR)が新たに発表した「グローバルロボティクス2019 -...

知っておくべき10の機械学習アルゴリズム

機械学習は、確率論、統計、近似理論、凸解析、アルゴリズム複雑性理論など、多くの分野が関わる多分野にわ...