10億のパラメータを持つAIモデルSEERは、すべての人を平等に扱い、富裕層と世界に貢献します。

厳選されラベル付けされたデータセットを使用して AI システムをトレーニングすると、オブジェクト認識などのタスクに優れた特殊な AI モデルが生成されます。

しかし、このアプローチだけに頼ることには実際的な限界があり、そのうちの 1 つは特に重要だと考えています。それは、このようなシステムでは、日常生活では一般的であるが、AI システムのトレーニングに使用されるデータでは十分に表現されていないオブジェクトを認識することが難しい場合があるということです。

特に、どの画像をトレーニングするか、どのようにラベルを付けるかについての選択によって、意図せずバイアスが導入される可能性があります。

たとえば、主に米国とヨーロッパの住宅の画像でトレーニングされた物体認識システムは、ネパールの住宅内の物体を認識するように求められた場合、それほど良いパフォーマンスを発揮しない可能性があります。

これが、私たちが開発した新しい高性能コンピュータービジョンシステムである SEER に期待を寄せている理由の 1 つです。

SEER は自己教師学習を活用することで、研究者が各オブジェクトを選択してラベル付けする必要なく、あらゆるデジタル画像のコレクションから学習できます。

予備評価では、数十億人の生活に存在しながらも、AI システムのトレーニングに使用される従来の画像データセットではあまり表現されていないオブジェクトの識別において、SEER は従来のコンピュータービジョンシステムよりも優れていることが示されています。

私たちは、SEER を使用して、これまで最も恩恵を受けてきたグループだけでなく、すべての人にとって AI がより良く機能するようにしたいと考えています。

人工知能をテストするために世界中から写真を集める

私たちは、2019 年にコンピュータービジョンシステムのバイアスに関する調査で Dollar Street Dataset を使用して SEER をテストしました。 SEER によって提供される結果は刺激的であり、自己教師あり学習により人工知能は世界中の人々にさらに良いサービスを提供できるようになります。

Dollar Street データセット - 世界中のさまざまな国や地域のさまざまな収入を持つ世帯

例えば、ネパールの家族の写真では、SEERの識別結果は、調味料、薬、ボウル、果物、社交的な飲酒です。

教師あり学習モデルは、洗浄器具、台所の流し、陳列品、ボウル、果物、調理器具、鍋を特定した。

つまり、SEER は画像内の物体を正しく識別しましたが、従来のシステムでは識別できませんでした。

画像出典: Facebook AI ブログ

次の写真は中国人の家族の写真です。SEER識別の結果は、調理器具、ストーブ、鍋、道具です。

教師あり学習モデルは、玄関の鍵、電源スイッチ、調理器具、壁掛け時計、ストーブを特定しました。

つまり、SEER は炉を正しく識別しましたが、従来のトレーニングシステムでは識別できませんでした。

画像出典: Facebook AI ブログ

下の写真はインドの小さな通りです。 SEERの認識結果は、自転車、街の風景、ゴミ、野菜畑です

教師あり学習モデルの認識結果は、果樹、家、自転車、ペット、屋根です。

画像出典: Facebook AI ブログ

すべての人のためのAI

自己教師学習は、ラベル付けされたトレーニングデータとして使用できる大量のデジタル化されたテキストがない言語や方言でのパフォーマンスの向上に大きな可能性を示しています。

上記の例では、SEER はオブジェクト認識において優れた性能を発揮しています。これは、モデルがデータキュレーションなしでランダムなインターネット画像でトレーニングされたことを考えると、もう 1 つの興味深い結果です。

これは、SEER のトレーニングに使用される自己教師ありアプローチが、富裕層だけでなく世界全体に効果的に役立つ AI システムを構築する取り組みに大きな影響を与える可能性があることを示唆しています。これらの取り組みはまだ始まりに過ぎませんが、私たちが非常に刺激的な進歩の道を歩んでいることは明らかです。

<<: Truffleを使用してスマートコントラクトをデプロイする方法

>>: たった2枚の写真でAIは完全なモーションプロセスを生成できる