データセットはオンデマンドで簡単に検索できます。このツールには、無料で利用できる約 2,000 の画像データセットがあります。

データセットはオンデマンドで簡単に検索できます。このツールには、無料で利用できる約 2,000 の画像データセットがあります。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習プロジェクトに取り組んでいる人は皆、この苦痛を抱えているようです。つまり、学術ウェブサイトや GitHub から適切なデータセットを見つけることです。

しかし今では、AI 開発を容易にするのに役立つ Web サイトがあります。

このプロジェクトは BIFROST と呼ばれ、合計1,899 個の画像データセットを含み、人間、地理空間、自動運転車などの特別な分類を持つデータセット検索ツールです。

ワンクリック検索、無料アクセス、元のデータベースへの直接リンクにより、適切なデータセットをすばやく見つけることができます。研究チームはシンガポール出身で、Redditでの人気は17時間で200を超えました。

説明書

早速、このウェブサイトにアクセスして試してみましょう〜

ご覧のとおり、このツールはタスク、アプリケーション、カテゴリ、タグ、または形式別に分類されています。

このウェブサイトは、「カテゴリー」別に、人間、地理空間、自動運転車、小売、3D など 18 のカテゴリーに分かれています。

左にスワイプして必要なカテゴリを選択すると、ワンクリックで結果を取得できます。3D例に挙げると、次のようなページが表示されます。

「Humans」を例にとると、インターフェースは次のようになります。

また、注目順に並べられていることもわかります。さらに、「最新」、「ラベル数最多」、「データセット サイズ」、「画像数最多」などのカテゴリを選択することもできます。

「クイック検索」に加えて、開発者の特定のニーズに応じて検索することもできます。

タスク タイプ、ラベル形式、画像の最小数などの「制約」を選択できます。

タスクの種類には、主に画像セグメンテーション、ターゲット検出、画像分類、ポーズ推定、視覚的推論、3D 再構築、ビデオ分類が含まれます。

ラベル形式には、YOLO、PASCAL、COCO、セグメンテーションなどがあります。

データセット

オブジェクトの検出、画像のセグメンテーション、キャプション作成に適した大規模なデータセットである COCO を例に挙げてみましょう。

インターフェースは次のとおりです。

主に、画像例、データセットの紹介、特徴、カテゴリ分布の 4 つのセクションに分かれています。

導入部では、このデータセットの研究チームや一文の紹介、CC4.0 プロトコルを通過する部分、さらに元のデータベースへの直接リンクや論文アドレスを確認できます。

CC4.0 プロトコルは、他の人が作品を配布することを許可するパブリック著作権ライセンスである Creative Commons ライセンスです。同様のライセンスとして、MIT プロトコルもあります。

今回著者らが選択した約 2,000 のデータ セットは、これら 2 つのプロトコルを通過しました。したがって、Web サイトはこれらのデータ セットを直接管理するのではなく、これらのデータ セットの「ポーター」にすぎません。

「カテゴリー分布」セクションでは、まずラベルが付いていない画像やラベルが多すぎる画像の数が表示されます。

次に、異なるラベル カテゴリに応じて、画像数の分布が表示されます。

このプロジェクトの責任者はシンガポール出身で、現在はBifrostのCEOを務めるCharles Wong氏です。

[[337055]]

彼はシンガポール工科デザイン大学で学士課程を修了し、MITグローバルリーダーシッププログラムに参加しました。

次に、彼らの仕事は以下の側面に焦点を当てます。

  1. ウェブサイト上のすべてのデータセットの包括的な分析
  2. 検索機能の向上
  3. ユーザーが独自のデータセットをアップロードして共有できるようにする
  4. 独自の合成データセットを生成する

「なぜ当社のデータが優れているのか?」

ウェブサイトでも紹介されているように、適切な画像データセットを高い精度と正確さで素早く見つけることができます。

ご興味がございましたら、下のリンクをクリックしてお試しください。

ウェブサイトアドレス: https://datasets.bifrost.ai/

<<:  AIが光子の時間を3D画像に変換し、時間の経過による世界を視覚化する

>>:  機械学習モデルのトレーニングの全プロセス!

ブログ    
ブログ    

推薦する

クラウドネットワークとAIに焦点を当てると、3大通信事業者の財務報告はどのようなことを明らかにするのでしょうか。

少し前に、中国移動、中国聯通、中国電信の3大通信事業者が2023年第2四半期の財務報告書を発表しまし...

犯罪を予測する人工知能(AI)の倫理的・法的危機

あなたが通りを歩いていると、突然パトカーが止まり、数人の警官が飛び降りてきて、あなたの腕をつかみ、逮...

新しいソートアルゴリズムの発明から始まる

このような単純なアルゴリズムは、先代のエンジニアが考え出したものであるに違いありません。初心者であっ...

2月10日に職場復帰ラッシュが到来し、北京は「急速AI温度検出器」の配備を開始した。

新型コロナウイルスによる肺炎の流行は依然として続いており、中国のさまざまな省や市では2月10日に大規...

2023年に出現するサイバー脅威、AI、量子コンピューティング、データ汚染まで

ハッカーや詐欺師が新しいテクノロジーを入手したり、古い脆弱性を悪用する新しい方法を考え出したりするに...

...

世界で最も引用率の高い中国の AI ジャーナルではどのような研究が行われていますか?

[[410109]]人工知能(AI)研究に関しては、中国が現在最もホットな国です。清華大学人工知能...

Google が TensorFlow Lite を Play サービスに導入

近年、大手テクノロジー企業は人工知能と機械学習の研究に力を入れています。その中でも、Googleはこ...

...

...

AIコンピューティングパワーギャップを越えて、人工知能コンピューティングセンターの産業的価値が強調される

「第14次5カ年計画」の骨子には「デジタル化の加速とデジタル中国の構築」という独立した章が設けられ、...

フードデリバリーロボット市場は11.6億規模に到達。美団は「台頭」するか?

近年、ロボット産業は急速に発展しており、工業、農業、サービスなど多くの分野でロボットが見られるように...

顔認識アプリケーションにおける人工知能の利点と欠点についての簡単な説明

1950年代にチューリングの論文「ロボットは考えることができるか?」が人工知能への扉を開いて以来、人...

中国工程院院士の李軍氏:単一車両知能には5つの大きな問題があり、自動運転には新たな技術的ルートが必要

Leifeng.com(公式アカウント:Leifeng.com)注:少し前、2020年世界インテリジ...

ついにAI、BI、ビッグデータ、データサイエンスをわかりやすく説明する人が出てきた

01 データデータは、携帯電話に残すデジタルフットプリントから健康記録、買い物履歴、エネルギーなどの...