Facebookは色を表現するために通信する2つのニューラルネットワークを作成

Facebookは色を表現するために通信する2つのニューラルネットワークを作成

色をどのように表現するか考えたことはありますか?最新の研究によると、人間は個別の記号を使用して領域の色を記録し、色を洗練させる過程で他の情報を追加していることがわかりました。これには何か理由があるのでしょうか? Facebook は 2 つのニューラル ネットワークの実験的現象を使用して情報をお伝えします。

人間の世界には何千もの言語がありますが、さまざまな色を表すために言葉を使用する方法は非常に一貫しています。

たとえば、多くの言語には赤とオレンジを表す 2 つの異なる単語がありますが、オレンジのさまざまな色合い (色がオレンジとオレンジ色) を表す、明確に区別された共通の単語が多数ある言語はありません。

たとえば、多くの口紅の色合いのそれぞれに固有の色名が割り当てられていたら、それを覚えるのは困難でしょう。

[[390533]]

言語学者たちは数学的なツールを使って、色の名前にこのような一貫性があるのは、人間が正確にコミュニケーションする必要性と記憶を最小限に抑える必要性のバランスを取るために言語を最適化しているからだと示しました。

追加の色の言葉を使用すると複雑さが増しますが、人々のコミュニケーション能力が大幅に向上することはありません。

Facebookの最近のAI研究では、2つの人工ニューラルネットワークに、見た色について互いに通信する方法を作成するように依頼したところ、AIも人間と同じように複雑さと正確さのバランスをとったことが示されました。

さらに、Facebook の研究チームは、連続した色空間を正確に記述するには、離散的な「色言語」しか使用できないことも発見しました。

これにより、コミュニケーションがどのように機能するかについての興味深い推測が生まれます。動物の「連続的な」鳴き声よりも、「離散的な」象徴的な言語の方がコミュニケーションに適しているということでしょうか?

モデル実装プロセス

まず、話す側(話者)と聞く側(聞き手)の 2 つのニューラル ネットワークを構築し、「コミュニケーション ゲーム」を確立します。ゲームの各ラウンドで、話者は連続した色空間から色を見て、シンボル(「単語」と見なすことができます)を出力します。リスナーはノイズ入力と同じ色または異なる色を見る場合があります。

リスナーはスピーカーが出力した単語を受け取り、正しい色のフラグメントを出力しようとします。最初は、スピーカーはランダムに単語を生成し、トレーニングの終わりまでに、各単語は色空間の連続した部分を表します。

研究チームは、ターゲット色とノイズ色の類似性を変えることでタスクの難易度を変えながら、実験を数回繰り返した。これらのバリエーションにより、色を命名するためのさまざまな「語彙」が生まれました。

訓練の最後に研究者らは語彙を分析し、AIが生成した色を表す言葉が人間の言語と性質が似ていることを発見した。さらに、どちらのタイプの言語も、複雑さと精度の間の可能な限り最良のトレードオフのセットを正式に定義する境界に近いです (図の黒い線)。

研究者らはその後の実験で、ニューラルネットワークが離散的なシンボルではなく連続的なシンボルを使用して通信できるようにした場合、複雑さと精度の間の最適なバランスが存在しなくなることを発見した。

2 つのニューラル ネットワークは引き続き通信できますが、通信効率は非常に低くなります。

言語はおそらく人間の最もユニークな特徴であり、私たちはそれを理解することなく日常生活で絶えず使用しています。

Facebook の研究によると、高度な AI モデルは実用的なアプリケーションに役立つだけでなく、人間の言語 (および一般的な認知) に関する科学的な疑問に答えるための実験ツールとしても機能することが示されています。

<<:  10 分でチャットボットを作成するにはどうすればよいでしょうか?

>>:  バグがあります! PyTorch が AMD CPU 搭載のコンピューターでハングする

ブログ    
ブログ    

推薦する

AIが再び大学入試小論文に挑戦、強力なハードコア技術で「数秒」の文章作成を実現

昨日(6月7日)、2022年度全国大学入学試験が始まりました。午前中に中国語科目試験が終了し、中国語...

Python に基づく簡単な自然言語処理の練習

Python によるシンプルな自然言語処理この記事は、Python をベースにした簡単な自然言語処理...

ニューラルコンピュータAIモデルのブレークスルー!トレーニング時間は1秒あたり120万フレームに達し、新記録を樹立

[[326502]]今週、IBMは、同社のニューラル・コンピュータ・システムが1秒あたり120万フレ...

人工知能:この冷たい水はちょうどいいタイミングで注がれます!

最近、AI(人工知能)同時通訳詐欺事件をめぐる議論がテクノロジーや翻訳界で話題となり、「AIは人間を...

...

...

...

今後 20 年間で、人工知能ロボットが介護士に取って代わり、高齢者の世話をすることになり、介護士よりも信頼できる存在になるでしょう。

人工知能の発達により、数十年、あるいは12年後には、人々は介護者やロボットを使って高齢者の世話をする...

...

...

Reddit ユーザーが「泣く」: 私はアルゴリズム エンジニアではなく、「パラメータ調整者」です

[[387580]]まず最初に質問させてください。あなたは自分が「スイッチャー」だと思いますか、それ...

企業の75%が現在ChatGPTを無効化しているか、永久に無効化する予定である。

BlackBerry が発表した新しい調査によると、世界中の組織の 75% が現在、職場での Ch...

2019年ディープラーニングフレームワークランキング(トップ10からトップ3まで)

【51CTO.comオリジナル記事】 1. 前に書く5Gは2019年上半期の輝く「星」と言えるが、...

アルトマンが帰ってきた!取締役会解散の強い要求、OpenAIの究極の宮廷闘争が始まる

スティーブ・ジョブズが解雇されてから王として復帰するまでに12年かかりましたが、サム・アルトマンの場...