Facebookは色を表現するために通信する2つのニューラルネットワークを作成

Facebookは色を表現するために通信する2つのニューラルネットワークを作成

色をどのように表現するか考えたことはありますか?最新の研究によると、人間は個別の記号を使用して領域の色を記録し、色を洗練させる過程で他の情報を追加していることがわかりました。これには何か理由があるのでしょうか? Facebook は 2 つのニューラル ネットワークの実験的現象を使用して情報をお伝えします。

人間の世界には何千もの言語がありますが、さまざまな色を表すために言葉を使用する方法は非常に一貫しています。

たとえば、多くの言語には赤とオレンジを表す 2 つの異なる単語がありますが、オレンジのさまざまな色合い (色がオレンジとオレンジ色) を表す、明確に区別された共通の単語が多数ある言語はありません。

たとえば、多くの口紅の色合いのそれぞれに固有の色名が割り当てられていたら、それを覚えるのは困難でしょう。

[[390533]]

言語学者たちは数学的なツールを使って、色の名前にこのような一貫性があるのは、人間が正確にコミュニケーションする必要性と記憶を最小限に抑える必要性のバランスを取るために言語を最適化しているからだと示しました。

追加の色の言葉を使用すると複雑さが増しますが、人々のコミュニケーション能力が大幅に向上することはありません。

Facebookの最近のAI研究では、2つの人工ニューラルネットワークに、見た色について互いに通信する方法を作成するように依頼したところ、AIも人間と同じように複雑さと正確さのバランスをとったことが示されました。

さらに、Facebook の研究チームは、連続した色空間を正確に記述するには、離散的な「色言語」しか使用できないことも発見しました。

これにより、コミュニケーションがどのように機能するかについての興味深い推測が生まれます。動物の「連続的な」鳴き声よりも、「離散的な」象徴的な言語の方がコミュニケーションに適しているということでしょうか?

モデル実装プロセス

まず、話す側(話者)と聞く側(聞き手)の 2 つのニューラル ネットワークを構築し、「コミュニケーション ゲーム」を確立します。ゲームの各ラウンドで、話者は連続した色空間から色を見て、シンボル(「単語」と見なすことができます)を出力します。リスナーはノイズ入力と同じ色または異なる色を見る場合があります。

リスナーはスピーカーが出力した単語を受け取り、正しい色のフラグメントを出力しようとします。最初は、スピーカーはランダムに単語を生成し、トレーニングの終わりまでに、各単語は色空間の連続した部分を表します。

研究チームは、ターゲット色とノイズ色の類似性を変えることでタスクの難易度を変えながら、実験を数回繰り返した。これらのバリエーションにより、色を命名するためのさまざまな「語彙」が生まれました。

訓練の最後に研究者らは語彙を分析し、AIが生成した色を表す言葉が人間の言語と性質が似ていることを発見した。さらに、どちらのタイプの言語も、複雑さと精度の間の可能な限り最良のトレードオフのセットを正式に定義する境界に近いです (図の黒い線)。

研究者らはその後の実験で、ニューラルネットワークが離散的なシンボルではなく連続的なシンボルを使用して通信できるようにした場合、複雑さと精度の間の最適なバランスが存在しなくなることを発見した。

2 つのニューラル ネットワークは引き続き通信できますが、通信効率は非常に低くなります。

言語はおそらく人間の最もユニークな特徴であり、私たちはそれを理解することなく日常生活で絶えず使用しています。

Facebook の研究によると、高度な AI モデルは実用的なアプリケーションに役立つだけでなく、人間の言語 (および一般的な認知) に関する科学的な疑問に答えるための実験ツールとしても機能することが示されています。

<<:  10 分でチャットボットを作成するにはどうすればよいでしょうか?

>>:  バグがあります! PyTorch が AMD CPU 搭載のコンピューターでハングする

ブログ    
ブログ    
ブログ    

推薦する

...

AI を使って「手を洗ってください」を 500 の言語に翻訳する方法

[[322940]]人間による翻訳と機械による翻訳の両方を使用することで、健康に関する重要なフレーズ...

OpenAI の公式チュートリアル: GPT-4 で議事録生成 AI を作成する方法

このチュートリアルでは、OpenAI の Whisper と GPT-4 モデルを使用して自動会議議...

自動化がビジネスに具体的な価値をもたらす方法

[[404690]]長年にわたり、多くの企業がロボット、自動化、人工知能などのテクノロジーからより多...

人工知能はソフトウェア開発業界にどのような影響を与えるでしょうか? AIはクリエイティブな労働者に取って代わることはできない

AI業界はクリエイティブなソフトウェア開発者を満足させることは決してできないでしょう。このテクノロジ...

「編集神ヴィム」の父が死去。ネットユーザー「彼は多くの人の人生を変えた」

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

5G、自動運転、AIがどの段階に到達したかを示す曲線

最近、世界で最も権威のあるIT市場調査およびコンサルティング会社であるガートナーは、新しいテクノロジ...

チューリング賞受賞者たちは口論。ルカン氏:ベンジオ氏、ヒントン氏らのAI絶滅理論はばかげている

AIのリスクの問題に関しては、さまざまな有力者がさまざまな意見を持っています。 AI研究室に研究を即...

...

...

顔認識を完了するための3行のPythonコード

顔認識パッケージこれは世界で最もシンプルな顔認識ライブラリです。 Python リファレンスまたはコ...

2022年のスマート製造のトレンド

製造業は過去 1 世紀にわたって大きく変化しました。 新しい高度なテクノロジーが業界を前進させるにつ...

...

ビジュアルMambaモデルのSwinの瞬間:中国科学院、HuaweiなどがVMambaを発表

大型模型の分野におけるトランスフォーマーの地位は揺るぎない。しかし、モデルのサイズが拡大し、処理する...

張衛斌:金融ビッグデータリスク管理モデリングは単なるデータとアルゴリズム以上のもの

2016年3月、中国データ最高責任者連盟が「中国ビッグデータ産業の発展に影響を与える100人」大規模...