厳選されラベル付けされたデータ セットを使用して AI システムをトレーニングすると、オブジェクト認識などのタスクに優れた特殊な AI モデルが生成されます。 しかし、このアプローチだけに頼ることには実際的な限界があり、そのうちの 1 つは特に重要だと考えています。それは、このようなシステムでは、日常生活では一般的であるが、AI システムのトレーニングに使用されるデータでは十分に表現されていないオブジェクトを認識することが難しい場合があるということです。 特に、どの画像をトレーニングするか、どのようにラベルを付けるかについての選択によって、意図せずバイアスが導入される可能性があります。 たとえば、主に米国とヨーロッパの住宅の画像でトレーニングされた物体認識システムは、ネパールの住宅内の物体を認識するように求められた場合、それほど良いパフォーマンスを発揮しない可能性があります。 これが、私たちが開発した新しい高性能コンピューター ビジョン システムである SEER に期待を寄せている理由の 1 つです。 SEER は自己教師学習を活用することで、研究者が各オブジェクトを選択してラベル付けする必要なく、あらゆるデジタル画像のコレクションから学習できます。 予備評価では、数十億人の生活に存在しながらも、AI システムのトレーニングに使用される従来の画像データセットではあまり表現されていないオブジェクトの識別において、SEER は従来のコンピューター ビジョン システムよりも優れていることが示されています。 私たちは、SEER を使用して、これまで最も恩恵を受けてきたグループだけでなく、すべての人にとって AI がより良く機能するようにしたいと考えています。 人工知能をテストするために世界中から写真を集める私たちは、2019 年にコンピューター ビジョン システムのバイアスに関する調査で Dollar Street Dataset を使用して SEER をテストしました。 SEER によって提供される結果は刺激的であり、自己教師あり学習により人工知能は世界中の人々にさらに良いサービスを提供できるようになります。 Dollar Street データセット - 世界中のさまざまな国や地域のさまざまな収入を持つ世帯 例えば、ネパールの家族の写真では、SEERの識別結果は、調味料、薬、ボウル、果物、社交的な飲酒です。 教師あり学習モデルは、洗浄器具、台所の流し、陳列品、ボウル、果物、調理器具、鍋を特定した。 つまり、SEER は画像内の物体を正しく識別しましたが、従来のシステムでは識別できませんでした。 画像出典: Facebook AI ブログ 次の写真は中国人の家族の写真です。SEER識別の結果は、調理器具、ストーブ、鍋、道具です。 教師あり学習モデルは、玄関の鍵、電源スイッチ、調理器具、壁掛け時計、ストーブを特定しました。 つまり、SEER は炉を正しく識別しましたが、従来のトレーニング システムでは識別できませんでした。 画像出典: Facebook AI ブログ 下の写真はインドの小さな通りです。 SEERの認識結果は、自転車、街の風景、ゴミ、野菜畑です 教師あり学習モデルの認識結果は、果樹、家、自転車、ペット、屋根です。 画像出典: Facebook AI ブログ すべての人のためのAI自己教師学習は、ラベル付けされたトレーニング データとして使用できる大量のデジタル化されたテキストがない言語や方言でのパフォーマンスの向上に大きな可能性を示しています。 上記の例では、SEER はオブジェクト認識において優れた性能を発揮しています。これは、モデルがデータキュレーションなしでランダムなインターネット画像でトレーニングされたことを考えると、もう 1 つの興味深い結果です。 これは、SEER のトレーニングに使用される自己教師ありアプローチが、富裕層だけでなく世界全体に効果的に役立つ AI システムを構築する取り組みに大きな影響を与える可能性があることを示唆しています。これらの取り組みはまだ始まりに過ぎませんが、私たちが非常に刺激的な進歩の道を歩んでいることは明らかです。 |
<<: Truffleを使用してスマートコントラクトをデプロイする方法
>>: たった2枚の写真でAIは完全なモーションプロセスを生成できる
[[326429]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...
8月21日、Googleの検索事業責任者アミット・シンガル氏はGoogle+に記事を掲載し、過去1...
最近、謎の新型コロナウイルスが驚くべき速さで猛威を振るっています。先週木曜日、世界保健機関(WHO)...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
近年、「オープンソース」は開発者コミュニティにおける新たなトレンドとなっています。特にディープラーニ...
[[322940]]人間による翻訳と機械による翻訳の両方を使用することで、健康に関する重要なフレーズ...
2021 年 12 月 21 日に arXiv にアップロードされた自動運転のための説明可能な AI...
今日は顔をスキャンしましたか? [[373513]]人工知能の急速な発展により、知能の時代が静かに到...
TesnsorFlow を使用して、基本的な機械学習モデルから複雑なディープラーニング ネットワーク...
どの大企業にとっても、調達は日々の業務において重要な役割を果たします。 [[317585]]企業は調...
テクノロジーの発展に伴い、クラウド コンピューティング テクノロジーは進歩し続け、その目的も変化して...
仕事以外では、私はほとんどの時間を2つの状態で過ごしています。1つは見出しを閲覧している状態で、もう...