Facebookは色を表現するために通信する2つのニューラルネットワークを作成

Facebookは色を表現するために通信する2つのニューラルネットワークを作成

色をどのように表現するか考えたことはありますか?最新の研究によると、人間は個別の記号を使用して領域の色を記録し、色を洗練させる過程で他の情報を追加していることがわかりました。これには何か理由があるのでしょうか? Facebook は 2 つのニューラル ネットワークの実験的現象を使用して情報をお伝えします。

人間の世界には何千もの言語がありますが、さまざまな色を表すために言葉を使用する方法は非常に一貫しています。

たとえば、多くの言語には赤とオレンジを表す 2 つの異なる単語がありますが、オレンジのさまざまな色合い (色がオレンジとオレンジ色) を表す、明確に区別された共通の単語が多数ある言語はありません。

たとえば、多くの口紅の色合いのそれぞれに固有の色名が割り当てられていたら、それを覚えるのは困難でしょう。

[[390533]]

言語学者たちは数学的なツールを使って、色の名前にこのような一貫性があるのは、人間が正確にコミュニケーションする必要性と記憶を最小限に抑える必要性のバランスを取るために言語を最適化しているからだと示しました。

追加の色の言葉を使用すると複雑さが増しますが、人々のコミュニケーション能力が大幅に向上することはありません。

Facebookの最近のAI研究では、2つの人工ニューラルネットワークに、見た色について互いに通信する方法を作成するように依頼したところ、AIも人間と同じように複雑さと正確さのバランスをとったことが示されました。

さらに、Facebook の研究チームは、連続した色空間を正確に記述するには、離散的な「色言語」しか使用できないことも発見しました。

これにより、コミュニケーションがどのように機能するかについての興味深い推測が生まれます。動物の「連続的な」鳴き声よりも、「離散的な」象徴的な言語の方がコミュニケーションに適しているということでしょうか?

モデル実装プロセス

まず、話す側(話者)と聞く側(聞き手)の 2 つのニューラル ネットワークを構築し、「コミュニケーション ゲーム」を確立します。ゲームの各ラウンドで、話者は連続した色空間から色を見て、シンボル(「単語」と見なすことができます)を出力します。リスナーはノイズ入力と同じ色または異なる色を見る場合があります。

リスナーはスピーカーが出力した単語を受け取り、正しい色のフラグメントを出力しようとします。最初は、スピーカーはランダムに単語を生成し、トレーニングの終わりまでに、各単語は色空間の連続した部分を表します。

研究チームは、ターゲット色とノイズ色の類似性を変えることでタスクの難易度を変えながら、実験を数回繰り返した。これらのバリエーションにより、色を命名するためのさまざまな「語彙」が生まれました。

訓練の最後に研究者らは語彙を分析し、AIが生成した色を表す言葉が人間の言語と性質が似ていることを発見した。さらに、どちらのタイプの言語も、複雑さと精度の間の可能な限り最良のトレードオフのセットを正式に定義する境界に近いです (図の黒い線)。

研究者らはその後の実験で、ニューラルネットワークが離散的なシンボルではなく連続的なシンボルを使用して通信できるようにした場合、複雑さと精度の間の最適なバランスが存在しなくなることを発見した。

2 つのニューラル ネットワークは引き続き通信できますが、通信効率は非常に低くなります。

言語はおそらく人間の最もユニークな特徴であり、私たちはそれを理解することなく日常生活で絶えず使用しています。

Facebook の研究によると、高度な AI モデルは実用的なアプリケーションに役立つだけでなく、人間の言語 (および一般的な認知) に関する科学的な疑問に答えるための実験ツールとしても機能することが示されています。

<<:  10 分でチャットボットを作成するにはどうすればよいでしょうか?

>>:  バグがあります! PyTorch が AMD CPU 搭載のコンピューターでハングする

推薦する

Google が TensorFlow Lite を Play サービスに導入

近年、大手テクノロジー企業は人工知能と機械学習の研究に力を入れています。その中でも、Googleはこ...

...

ディープ ニューラル ネットワークを構築するための 20 の「未熟な」ヒント

当社の機械学習ラボでは、数多くの高性能マシンで何万時間ものトレーニングを行って豊富な経験を蓄積してき...

突如、Stable Diffusion 3がリリースされました!ソラと同じアーキテクチャですが、すべてがよりリアルです

1年以上の開発期間を経て、前世代に比べて3つの主要な機能に進化しました。さあ、効果を直接確かめてみま...

自動運転車の運転分類と必要な処理能力

今後 20 ~ 30 年で、自動運転車 (AV) は私たちの運転習慣や輸送業界を変え、社会全体に影響...

自動化によってセキュリティアナリストがいなくなる可能性はありますか?

否定できない現実として、私たちは自動化の時代に入り、それに伴い人工知能 (AI)、機械学習 (ML)...

OpenAI: 大規模ニューラルネットワークをトレーニングするための 4 つの基本手法

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

AIは私たちが何を見て、何を考えるかを静かにコントロールしている

私たちの日常生活では、携帯電話のさまざまなアプリにますます依存するようになっています。外食時にレスト...

人工知能はデジタルマーケティング革命において否定できないトレンドとなっている

人工知能 (AI) は、現在、デジタル マーケティング革命における否定できないトレンドとなっています...

...

データサイエンスの分野で働くにはどのようなスキルが必要ですか?

本記事では、海外KDnuggetsフォーラムにおけるSimplilearnの統計結果と、国内有名求人...

...

機械学習を実践するための10のヒント

開発者にとって、クラウドベースの機械学習ツールは、機械学習を使用して新しい機能を作成し、提供する可能...

なぜ人工知能が将来主流になるのか、これを読めば分かる

人工知能と自動化は将来のトレンドではないでしょうか?機械に人体の複雑な筋肉や動作を認識させる方法を考...

最大速度アップは20億倍! AIが物理シミュレーションエンジンに革命を起こす

[[422090]]オックスフォード大学の研究によると、機械学習モデルは従来の物理ソルバーに比べて物...