無料の機械学習ベンチマークツール:主要なデータセットを統合し、GitHubに接続して使用する

無料の機械学習ベンチマークツール:主要なデータセットを統合し、GitHubに接続して使用する

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習に携わっている友人は、必然的にさまざまなデータセットで AI モデルを実行する必要があります。

現在、 Papers with Codeチームは、すべてのオープンソース モデルを実行することを目的としたsotabenchと呼ばれる自動ベンチマーク サービスを開始しました。

これを使用すると、コードをアップロードする必要はなく、GitHub プロジェクトに接続するだけで、クラウド GPU がスコアの実行を支援します。新しいコミットが送信されるたびに、システムが自動的にスコアを更新します。様々な強豪選手の活躍が見られる世界ランキングリストもございます。

主要な主流データセットのサポートに加えて、ユーザーが独自のデータセットをアップロードすることもサポートします。

他の人の論文の結果が信頼できるかどうかも調べることができます。

たとえば、Facebook の FixRes プロジェクトをフォークし、評価ファイルを設定します。

次に、ワンクリックで接続し、Sotabench の GPU で ImageNet 画像分類テストを実行します。

次のような結果が得られます。

トップ 1 の精度、トップ 5 の精度、論文の結果との差 (注を参照)、実行速度、世界ランキングなどがすべて明確に表示されます。

注: ε-REPR の場合、結果と論文結果の差が 0.3% 以内であればチェックマークが表示されます。差が 0.3% 以上で論文結果より悪い場合は赤い十字が表示されます。結果が論文結果より優れている場合はチェックマーク + が表示されます。

この無料のベンチマーク ツールは、リリースから 1 日以内に大好評を博し、Twitter で 600 件以上の「いいね!」、Reddit で 270 件以上のヒットを獲得しました。

ネットユーザーはこう言った: これは開発者コミュニティにとって非常に役立ちます!

それでは、sotabenchの機能と使い方を見てみましょう。

使い方は簡単、すべてに対応

チームによれば、 SotabenchPapers with Codeの双子の姉妹であるとのこと。

紙のレポートのスコアを継続的に監視する Papers with Code は誰もがよく知っています。高得点モデルに対応するコードを見つけるために使用でき、人類に利益をもたらすツールです。

それを補完するものとして、SotaBench はオープンソース プロジェクトとコードの実際の実行結果を観察します。自分のモデルをテストし、他の人のモデルを検証して、論文で言われているほど強力かどうかを確認できます。

他のモデルとの比較をサポートし、速度と精度のトレードオフを表示できます。

では、sotabench はどのように使うのでしょうか?簡単、たった2ステップ。

最初のステップは、モデルをローカルで評価することです。

GitHub プロジェクトのルート ディレクトリに、sotabench.py​​ ファイルを作成します。データセットを読み込んで処理し、そこから予測を導き出すために必要なロジックを含めることができます。このファイルはコミットごとに実行されます。次に、オープンソースのベンチマーク ライブラリを使用してモデルを実行します。このライブラリは、フレームワークに依存せず、ImageNet などのデータセットを含む sotabench-eval にすることができます。また、PyTorch データセット ローダーで使いやすい PyTorch ライブラリである torchbench にすることもできます。

正常に実行されたら、次の手順に進むことができます。

2 番目のステップは GitHub プロジェクトに接続することです。sotabench が以下の実行をお手伝いします。

このボタンをクリックすると、GitHub アカウントに接続し、さまざまなプロジェクトが表示されます。接続をテストするプロジェクトを選択します。接続後、システムはマスターを自動的にテストし、公式結果を記録します。すべてはクラウド GPU 上で実行されます。テスト環境は requirements.txt ファイルに基づいて設定されているため、このファイルをリポジトリに追加して、システムが使用する依存関係をキャプチャできるようにします。

今後は、コミットを送信するたびに、システムがスコアを再実行し、スコアが最新であり、更新されたモデルが引き続き機能していることを確認します。

この方法では、モデルにバグがある場合、それをすぐに知ることができます。

[[278983]]

他の人のモデルを実行したい場合は、自分のモデルにフォークするだけです。

現在、sotabench はすでにいくつかの主流のデータ セットをサポートしています。

リストはまだ更新中であり、チームはベンチマーク ファミリーを充実させるために、あらゆる分野のヒーローを心から招待しています。

新しいベンチマークの作成と、既存のベンチマークへの新しい実装の追加の両方をサポートします。

sotabench-eval または torchbench プロジェクトに PR を送信するか、新しい Python パッケージを直接作成することができます。

準備ができたら、sotabench フォーラムに新しいトピックを投稿すると、チームがベンチマークを追加します。

絶賛のレビュー

このサービスが開始されると、ネットユーザーたちはこのサービスに賛同し、Twitter で 600 件を超える「いいね!」を獲得するなど、絶賛のレビューを寄せました。

一部のネットユーザーはこう言った。

素晴らしい!初心者にとっては、データセットの取得、前処理、評価の自動化と標準化が役立ちます。さまざまなモデルとそのハイパーパラメータの結果を分析してこれらのモデルを評価することは、それ自体が難しい作業であり、さまざまな論文の大量の非構造化データを調べる必要があります。これにより、問題ははるかに簡単になります。 (部分翻訳)

多くのネットユーザーがこのプロジェクトについて友好的な議論や提案を行っており、開発者もオンラインで好意的に反応しています。

たとえば、このネットユーザーは次のように提案しています: モデルのハイパーパラメータは、送信されるたびに報告できますか?

著者はすぐにこう答えました。「偉大な心は同じように考える。」次のアップデートで追加します!

さらに、将来のアップデートでは、ユーザーが生成モデルのトレーニングパラメータへのリンクを追加できるようにすることを検討しています。

ポータル

sotabench公式サイト:

https://sotabench.com/

ベンチマークライブラリの汎用バージョン:

https://github.com/paperswithcode/sotabench-eval

ベンチマークライブラリ PyTorch バージョン:

https://github.com/paperswithcode/torchbench

<<:  人工知能への恐怖とその対処法5つ

>>:  AdobeなどがAIを活用しアニメキャラクターのポーズ移行を実現する新タイプの「パペットアニメーション」を提案

ブログ    
ブログ    

推薦する

...

顔認識は数十億ドル規模のブルーオーシャンだが、まだ解決すべき問題が2つある

今日は顔をスキャンしましたか? [[373513]]人工知能の急速な発展により、知能の時代が静かに到...

0コードの微調整大型モデルが人気で、わずか5ステップで、コストは150元と低い

0 コードの大規模モデルを20 ドル未満で微調整できますか?プロセスも非常に簡単で、必要なステップは...

...

マイクロソフトの人工知能音声技術は「複数の感情レベル」の調整をサポートし、「人間の声」の繊細な解釈を可能にする

IT Homeは4月12日、マイクロソフトが最近、最新の音声技術を発表したと報じた。この技術は「感情...

人工知能が野生生物保護活動に貢献

犯罪現場の足跡が貴重な証拠となるのと同様に、野生動物の足跡も野生生物保護活動家にとって同様に貴重なも...

アリババ副社長でDAMOアカデミーの自動運転部門責任者の王剛氏が辞任し、自身のビジネスを立ち上げる予定

マシンハートは、アリババの副社長であり、DAMOアカデミーの自動運転研究所の所長である王剛氏が最近辞...

AIがビジネスとマーケティングの未来をどう形作るのか

ここで、AI がビジネスとマーケティングの未来をどのように形作っていくのかを見てみましょう。有名な諺...

人工知能はマーケティングをどのように変えるのでしょうか?

今日でも、私たちは人工知能 (AI) を未来のテクノロジーだと考えています。そのため、この分野で起こ...

ビジョンから現実へ: ヘルスケアにおける AI の台頭

[51CTO.com速訳]人工知能分野における音声インタラクション、コンピュータビジョン、認知コンピ...

インターネットの価値観を修正するガバナンスアルゴリズム

最近、中国サイバースペース管理局は「インターネット情報サービスアルゴリズム推奨管理規則(草案)」(以...

...

...

機械学習の4つの異なるカテゴリの概要

[[420892]]学習の実行方法に基づいて、アルゴリズムをさまざまなカテゴリに分類できます。教師あ...