10億のパラメータを持つAIモデルSE​​ERは、すべての人を平等に扱い、富裕層と世界に貢献します。

10億のパラメータを持つAIモデルSE​​ERは、すべての人を平等に扱い、富裕層と世界に貢献します。

厳選されラベル付けされたデータ セットを使用して AI システムをトレーニングすると、オブジェクト認識などのタスクに優れた特殊な AI モデルが生成されます。

しかし、このアプローチだけに頼ることには実際的な限界があり、そのうちの 1 つは特に重要だと考えています。それは、このようなシステムでは、日常生活では一般的であるが、AI システムのトレーニングに使用されるデータでは十分に表現されていないオブジェクトを認識することが難しい場合があるということです。

[[397527]]

特に、どの画像をトレーニングするか、どのようにラベルを付けるかについての選択によって、意図せずバイアスが導入される可能性があります。

たとえば、主に米国とヨーロッパの住宅の画像でトレーニングされた物体認識システムは、ネパールの住宅内の物体を認識するように求められた場合、それほど良いパフォーマンスを発揮しない可能性があります。

これが、私たちが開発した新しい高性能コンピューター ビジョン システムである SEER に期待を寄せている理由の 1 つです。

SEER は自己教師学習を活用することで、研究者が各オブジェクトを選択してラベル付けする必要なく、あらゆるデジタル画像のコレクションから学習できます。

予備評価では、数十億人の生活に存在しながらも、AI システムのトレーニングに使用される従来の画像データセットではあまり表現されていないオブジェクトの識別において、SEER は従来のコンピューター ビジョン システムよりも優れていることが示されています。

私たちは、SEER を使用して、これまで最も恩恵を受けてきたグループだけでなく、すべての人にとって AI がより良く機能するようにしたいと考えています。

人工知能をテストするために世界中から写真を集める

私たちは、2019 年にコンピューター ビジョン システムのバイアスに関する調査で Dollar Street Dataset を使用して SEER をテストしました。 SEER によって提供される結果は刺激的であり、自己教師あり学習により人工知能は世界中の人々にさらに良いサービスを提供できるようになります。

[[397528]]

Dollar Street データセット - 世界中のさまざまな国や地域のさまざまな収入を持つ世帯

例えば、ネパールの家族の写真では、SEERの識別結果は、調味料、薬、ボウル、果物、社交的な飲酒です。

教師あり学習モデルは、洗浄器具、台所の流し、陳列品、ボウル、果物、調理器具、鍋を特定した。

つまり、SEER は画像内の物体を正しく識別しましたが、従来のシステムでは識別できませんでした。

[[397529]]

画像出典: Facebook AI ブログ

次の写真は中国人の家族の写真です。SEER識別の結果は、調理器具、ストーブ、鍋、道具です。

教師あり学習モデルは、玄関の鍵、電源スイッチ、調理器具、壁掛け時計、ストーブを特定しました。

つまり、SEER は炉を正しく識別しましたが、従来のトレーニング システムでは識別できませんでした。

[[397530]]

画像出典: Facebook AI ブログ

下の写真はインドの小さな通りです。 SEERの認識結果は、自転車、街の風景、ゴミ、野菜畑です

教師あり学習モデルの認識結果は、果樹、家、自転車、ペット、屋根です。

[[397531]]

画像出典: Facebook AI ブログ

すべての人のためのAI

自己教師学習は、ラベル付けされたトレーニング データとして使用できる大量のデジタル化されたテキストがない言語や方言でのパフォーマンスの向上に大きな可能性を示しています。

上記の例では、SEER はオブジェクト認識において優れた性能を発揮しています。これは、モデルがデータキュレーションなしでランダムなインターネット画像でトレーニングされたことを考えると、もう 1 つの興味深い結果です。

これは、SEER のトレーニングに使用される自己教師ありアプローチが、富裕層だけでなく世界全体に効果的に役立つ AI システムを構築する取り組みに大きな影響を与える可能性があることを示唆しています。これらの取り組みはまだ始まりに過ぎませんが、私たちが非常に刺激的な進歩の道を歩んでいることは明らかです。

<<:  Truffleを使用してスマートコントラクトをデプロイする方法

>>:  たった2枚の写真でAIは完全なモーションプロセスを生成できる

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

科学サブ出版物:人間の脳は加速学習メカニズムを備えており、その計算能力は最新のAIアルゴリズムを上回っている

[[323595]]機械学習とディープラーニングのアルゴリズムは、脳内のニューロンを結びつけるシナプ...

目標駆動型システムモデルは、人工汎用知能 (AGI) を実現するための鍵となるでしょうか?

人工知能の登場以来、研究者たちはロボットに人間とゲームをさせることで機械システムの知能をテストしよう...

予測によると、人工知能市場は急速に成長し続けるだろう

スペイン紙エル・ムンドのウェブサイトが2月20日に報じたところによると、ソフトウェア、ハードウェア、...

顔認識:最高裁は規則に従うよう求めている

近年、顔認識技術は急速に発展し、入場時の顔スキャンや支払い時の顔スキャンに広く使用され、私たちの日常...

インターネット業界における顔認識機能の認知に関する調査報告書

[51CTO.comからのオリジナル記事] 高速かつ高性能なコンピュータの登場により、顔画像技術は大...

画像内のテキストを心配する必要はありません。TextDiffuserは高品質のテキストレンダリングを提供します。

近年、テキストから画像への変換の分野は、特に AIGC (人工知能生成コンテンツ) の時代において大...

コードを自動生成できるAIベースの開発ツール5選

今日、機械学習の可能性に関心を持つプログラマーは、人工知能と AI ベースのソフトウェア開発ツールを...

...

ヘルスケアにおける GenAI の利点

ビッグデータと AI の活用により、患者が生成する膨大な量の情報の処理と分析が大幅に容易になりました...

人工知能とはいったい何でしょうか?たぶん多くの人がこれを知らないでしょう!

今後10年間で、翻訳者、ジャーナリスト、アシスタント、警備員、運転手、販売員、カスタマーサービス、ト...

...

AI は DevOps をどのように変えるのでしょうか?

DevOps は、コードの品質を損なうことなく、ソフトウェア開発プロセスを加速し、顧客に価値をより...

Telstra はディープラーニングを使用してネットワークの課題に取り組んでいます。

テルストラは、機器の故障を早期に予測し、音声やテキストによる詐欺に対抗する方法を見つけるために、ネッ...