Facebookは色を表現するために通信する2つのニューラルネットワークを作成

Facebookは色を表現するために通信する2つのニューラルネットワークを作成

色をどのように表現するか考えたことはありますか?最新の研究によると、人間は個別の記号を使用して領域の色を記録し、色を洗練させる過程で他の情報を追加していることがわかりました。これには何か理由があるのでしょうか? Facebook は 2 つのニューラル ネットワークの実験的現象を使用して情報をお伝えします。

人間の世界には何千もの言語がありますが、さまざまな色を表すために言葉を使用する方法は非常に一貫しています。

たとえば、多くの言語には赤とオレンジを表す 2 つの異なる単語がありますが、オレンジのさまざまな色合い (色がオレンジとオレンジ色) を表す、明確に区別された共通の単語が多数ある言語はありません。

たとえば、多くの口紅の色合いのそれぞれに固有の色名が割り当てられていたら、それを覚えるのは困難でしょう。

[[390533]]

言語学者たちは数学的なツールを使って、色の名前にこのような一貫性があるのは、人間が正確にコミュニケーションする必要性と記憶を最小限に抑える必要性のバランスを取るために言語を最適化しているからだと示しました。

追加の色の言葉を使用すると複雑さが増しますが、人々のコミュニケーション能力が大幅に向上することはありません。

Facebookの最近のAI研究では、2つの人工ニューラルネットワークに、見た色について互いに通信する方法を作成するように依頼したところ、AIも人間と同じように複雑さと正確さのバランスをとったことが示されました。

さらに、Facebook の研究チームは、連続した色空間を正確に記述するには、離散的な「色言語」しか使用できないことも発見しました。

これにより、コミュニケーションがどのように機能するかについての興味深い推測が生まれます。動物の「連続的な」鳴き声よりも、「離散的な」象徴的な言語の方がコミュニケーションに適しているということでしょうか?

モデル実装プロセス

まず、話す側(話者)と聞く側(聞き手)の 2 つのニューラル ネットワークを構築し、「コミュニケーション ゲーム」を確立します。ゲームの各ラウンドで、話者は連続した色空間から色を見て、シンボル(「単語」と見なすことができます)を出力します。リスナーはノイズ入力と同じ色または異なる色を見る場合があります。

リスナーはスピーカーが出力した単語を受け取り、正しい色のフラグメントを出力しようとします。最初は、スピーカーはランダムに単語を生成し、トレーニングの終わりまでに、各単語は色空間の連続した部分を表します。

研究チームは、ターゲット色とノイズ色の類似性を変えることでタスクの難易度を変えながら、実験を数回繰り返した。これらのバリエーションにより、色を命名するためのさまざまな「語彙」が生まれました。

訓練の最後に研究者らは語彙を分析し、AIが生成した色を表す言葉が人間の言語と性質が似ていることを発見した。さらに、どちらのタイプの言語も、複雑さと精度の間の可能な限り最良のトレードオフのセットを正式に定義する境界に近いです (図の黒い線)。

研究者らはその後の実験で、ニューラルネットワークが離散的なシンボルではなく連続的なシンボルを使用して通信できるようにした場合、複雑さと精度の間の最適なバランスが存在しなくなることを発見した。

2 つのニューラル ネットワークは引き続き通信できますが、通信効率は非常に低くなります。

言語はおそらく人間の最もユニークな特徴であり、私たちはそれを理解することなく日常生活で絶えず使用しています。

Facebook の研究によると、高度な AI モデルは実用的なアプリケーションに役立つだけでなく、人間の言語 (および一般的な認知) に関する科学的な疑問に答えるための実験ツールとしても機能することが示されています。

<<:  10 分でチャットボットを作成するにはどうすればよいでしょうか?

>>:  バグがあります! PyTorch が AMD CPU 搭載のコンピューターでハングする

ブログ    
ブログ    

推薦する

2021年9月のドローン業界の最新動向を3分で振り返る

現在、人工知能や5Gなどの技術の助けを借りて、我が国のドローン開発は急速な成長の軌道に乗っています。...

機械学習の教科書に出てくる7つの典型的な問題

[[201516]]機械学習について学びたい、または機械学習に専念することを決心した場合、すぐにさま...

ブックマークにおける不正行為の特定におけるグラフィカル モデルの応用

概要グラフィカル モデルは通常、問題自体に複数の相互に関連する変数があるシナリオで使用され、これらの...

「ロボットツアーガイド」の導入により、観光体験に斬新さが加わる

近年、科学技術の進歩に牽引され、知能ロボットは目覚ましい発展を遂げています。チップ、視覚システム、セ...

sklearn 機械学習の使い方を 5 分で解説します (パート 1)

[[205998]]皆さんのお役に立てれば幸いですので、この投稿を書くのは大変でした。機械学習とデ...

マイクロソフト、2023年までに8つの人工知能プロジェクトをオープンソース化へ

著者 | ツァミア・アンサリ企画 | ヤン・ジェンマイクロソフトは、ソフトウェア大手の元CEO、ステ...

Open Interpreterは、大規模な言語モデルのコードをローカルで実行できるようにするオープンソースツールです。

最近、Github を閲覧していたところ、Open Interpreter という魔法のツールを見つ...

...

...

人工知能の分野に早く参入したいJavaプログラマーですか?準備はできたか?

導入今日は、Java プログラマーとして人工知能の分野に素早く参入する方法について説明します。現在、...

トップエキスパートが語る: 生成型AIとロボット工学の未来

ビッグデータダイジェスト制作最近、カーネギーメロン大学、カリフォルニア大学バークレー校、Meta、N...

2022年の人工知能ロボットの5つのトレンド

ロボット工学は近年驚異的な進歩を遂げました。ロボティックプロセスオートメーションなどの分野は、ますま...

生成 AI は私たちに必要な技術革命でしょうか?

アンディ・ノーラン過去、生成 AI について多くの人が話し、使用し、さまざまなユースケースを試してき...

無料の Python 機械学習コース 6: ニューラル ネットワーク アルゴリズム

ニューラルネットワークは人間の脳を模倣するために開発されました。まだ実現されていないものの、ニューラ...