何？ニューラルネットワークは新しい知識も生み出せるのでしょうか?

作業を実行するための明示的なアルゴリズムを知らなくても、特定のタスク用にニューラルネットワーク (NN) を設計し、トレーニングできるという事実に、多くの人が驚嘆しています。たとえば、有名な手書き数字認識のチュートリアルはわかりやすいですが、その背後にあるロジックはニューラルネットワーク内に隠されており、階層構造、重み、および活性化関数を通じてのみ垣間見ることができます。

[[269379]]

画像ソース: Unsplash

この論文では、ニューラルネットワークの透明性原理を通じて、ニューラルネットワークの「ブラックボックス知識」を明らかにします。この目的のために、ブール XOR 関数を備えたニューラルネットワークを検証します。まず、既知の代数関係を明確に含む既知の XOR プロパティプロセスを使用して、ボトムアップニューラルネットワークが構築されます。 2 番目のステップでは、TensorFlow Keras を使用して、シンプルなグラフィカルプログラミングツールから XOR ロジック演算までニューラルネットワークをトレーニングします。

*** 2 つの方法を比較します。 Keras ニューラルネットワークをブールコンポーネントに分解すると、論理設定が最初のステップで構築されたニューラルネットワークと異なることがわかります。トレーニングされたニューラルネットワークは、異なるブール関数を使用して XOR 演算の代替表現を発見しました。

この代替 XOR 式は数学では知られていないわけではありませんが、少なくとも新しいものです。これは、ニューラルネットワークが新しい知識を生み出せることを示唆している可能性があります。しかし、それを抽出するには、ニューラルネットワークの設定とパラメーターを明示的なルールに変換できなければなりません。

XOR ニューラルネットワーク (XOR NN) のボトムアップ構築

XOR演算はマッピングによって定義されるブール関数であり、

排他的論理和 (0,0) = 排他的論理和 (1,1) = 0
排他的論理和 (1,0) = 排他的論理和 (0,1) = 1

XOR演算用の既知のニューラルネットワークまたはGoogle ID列を構築する

XOR (x,y) = AND ( NAND (x,y) 、 OR (x,y) )

これは、演算子 AND、NAND (AND ではない)、および OR がよく知られており、これらはすべて、2 つの入力ノードと 1 つの出力ノード、バイアス、およびシグモイド活性化関数を持つ単純なニューラルネットワークで表現できるため役立ちます。

ブール関数演算子のニューラルネットワーク

これを基に、NAND、AND、OR NN を接続することで XOR ニューラルネットワークを構築できます。したがって、XOR は 3 層のニューラルネットワークになります。

XOR演算によるニューラルネットワーク

可能な入力構成を入力し、出力を調べます (この記事で使用されている Excel ワークシート)。実効値は、(0,0)と(1,1)の場合はそれぞれ0.0072、(0,1)と(1,0)の場合は0.9924です。

他のニューラルネットワークは、XOR 演算の次の表現を使用して構築できます。

 XOR (x,y) = OR ( AND ( NOT(x) , y ) , AND ( x , NOT(y) ) )
 XOR (x,y) = NAND ( NAND ( x 、 NAND ( x,y) ) 、 NAND ( y 、 NAND ( x,y) ) )

ただし、これらの ID 列により、ネットワークはより複雑になります。

さらに、XOR 演算は線形に分離可能ではないため (活性化関数は厳密に単調であるため)、2 層ニューラルネットワークを構築することはできません。

しかし、XOR 演算を実行するニューラルネットワークを構築する他の方法があるかもしれません。次のセクションでは、ニューラルネットワークをトレーニングして別のソリューションを探します。

TensorFlow Keras を使用した XOR ニューラルネットワークの構築

Keras は強力で使いやすいニューラルネットワークライブラリです。前のセクションでは、3 層の 2-2-1 モデルを構築し、以前に構築したニューラルネットワークと比較しました。

エラーバックプロパゲーションは、ニューラルネットワークを構築するための標準的なアプローチである、学習率 1 と平均二乗誤差損失関数を持つ勾配降下法オプティマイザーを使用して実行されました。

以下は Python コードスニペットです。

 # XOR演算用のNNを生成する
# 入力層: < NODES >ノード、各ビットに 1 つ ( 0 = false 、 + 1 = true )
 # 出力層: 結果用のノード 1 つ ( 0 = false 、+ 1 = true )
 # シグモイド活性化関数、勾配降下法オプティマイザー、平均二乗誤差損失関数を使用する
# 最終更新日: 2019年5月28日
  
テンソルフローをtfとしてインポートする
numpyをnpとしてインポートする
matplotlib.pyplot を plt としてインポートします。 
  
 # モデルを定義する
ノード= 2  
モデル= tf .keras.Sequential()
 model.add(tf.keras.layers.Dense(ノード、 input_dim = 2 、アクティベーション= tf .nn.sigmoid))
モデルを追加します(tf.keras.layers.Dense(1, activation = tf.nn.sigmoid ))
 model.compile(オプティマイザー= tf .train.GradientDescentOptimizer(1),損失= tf .keras.losses.mean_squared_error,メトリック= ['binary_accuracy'])
モデル.要約() 
  
 # トレーニングデータとテストデータを生成する
エポック= 10000  
データ入力= np .array([[0,0],[0,1],[1,0],[1,1]])
 data_out = np.array ([0,1,1,0]) 
  
 # 列車モデル
history = model .fit(data_in, data_out, epochs epochs =epochs, verbose = 0 ) 
  
 # トレーニング履歴の分析
history.history.keys() のキーの場合:
    plt.scatter(範囲(エポック), history.history[キー], s = 1 )
    plt.ylabel(キー)
    plt.xlabel('エポック')
    plt.show() 
  
 # モデルで予測する
結果= model.predict (data_in) 
  
 # 結果を印刷
def printarray(arr):
    np.array2string(arr).replace('\n','') を返します。 
  
印刷()
 print('input', printarray(data_in))
 print('出力（計算）', printarray(data_out))
 print('出力 (予測) ', printarray(結果))
 print('出力 (予測ノルム)', printarray(np.round(結果))) 
  
 # モデルの重みを取得
印刷()
印刷(model.get_weights())

XOR 演算の利点は、教えることができる構成が 4 つしかないため、パラメーター空間全体をトレーニングできることです。ただし、モデルを駆動して損失ゼロと 100% の精度を達成するには、データセットをニューラルネットワークに渡す何らかのプロセスが必要です。つまり、出力はゼロに近づき、それぞれ (0,1)、(1,0)、(0,0)、(1,1) になります。

XOR ニューラルネットワークの損失とエポックの比較

XORニューラルネットワークの精度とエポックの比較

しかし、トレーニング期間が停滞し、接続できなくなる可能性もあります。すると、精度は 75% または 50% で止まります。つまり、1 つまたは 2 つのバイナリタプルのマッピングが正しくありません。この場合、適切なソリューションが得られるまでニューラルネットワークを再構築する必要があります。

分析と結論

ここで、Keras ニューラルネットワークが構築されたものと同様の構造を持っていることを確認します。重みを返すことによって (コードスニペットの最後を参照)、重みとバイアス値を取得します。

Pythonスクリプトの出力

これらのパラメータを使用して、ニューラルネットワークを再構築します (この場合も Excel を使用)。 3 つの演算子で構成されます。

Keras でトレーニングされた XOR ニューラルネットワーク

可能なすべての構成を入力することで、H1、H2、および O 演算子に関連付けられたブール関数を識別できます。

Keras XOR ニューラルネットワークのブール関数

興味深いことに、Keras ニューラルネットワークは構築されたものと同じロジックを持っていると思っていましたが、別のソリューションが作成されました。ニューラルネットワークが見つけた式である演算子 NAND、OR、AND の代わりに、OR、AND、(比較的知られていない) INH を使用します。

 XOR (x,y) = INH ( OR (x,y)、 AND (x,y) )

これは、ニューラルネットワークが以前にはなかった知識を獲得できることを示しています。もちろん、「新しい知識」は相対的なものであり、既知の程度によって異なります。つまり、XOR 演算のすべての表現を知っていれば、Keras ニューラルネットワークには追加の価値はありません。

さらに、より複雑なニューラルネットワークの場合、重みを明示的なアルゴリズムまたは数式に変換するのは簡単ではありません。しかし、おそらくこの種の専門知識こそが、将来の AI 専門家が備えていなければならないものなのでしょう。

<<: 求人検索サイトIndeedの統計：AI採用は減速、求職者の関心は低下

>>: JavaScript チュートリアル: Web アプリケーションに顔検出機能を追加する

150 ページの「幾何学的ディープラーニング」がオンラインになりました: 対称性と不変性を利用して機械学習の問題を解決する

ブログ

何？ニューラルネットワークは新しい知識も生み出せるのでしょうか?

150 ページの「幾何学的ディープラーニング」がオンラインになりました: 対称性と不変性を利用して機械学習の問題を解決する

人工知能とメタバースの関係を探る

NRS2019 インタビュー | テンセントの上級アルゴリズム研究者、唐宇堯氏: 新たな小売業のシナリオにおける人工知能の効率革命

合成データとAIの「非現実的な」世界を探る

ジャック・マー：世界の未来を決めるのは技術ではなく、技術の背後にある人々、理想、価値観だ

AIがCIOの役割をどう変えるのか

ワンジ自動車ミリ波レーダーポイントクラウド技術の分析

ヘルスケア業界における人工知能と機械学習の応用

推薦する

20世紀の最も偉大なアルゴリズム10選

AI モデルの「アウトソーシング」をやめましょう!新しい研究によると、機械学習モデルのセキュリティを弱める「バックドア」の一部は検出できないことが判明した。

モデル、データ、フレームワークの観点から、効率的な大規模言語モデルに関する54ページのレビューを紹介します。

ゼロから学ぶPythonによるディープラーニング！

従来のジムも人工知能によって消滅してしまうのでしょうか？

ビッグデータは経済生活に影響を与え、AIの基礎となる

認知知能を業界の奥深くまで導くWAIC Baiduが言語と知識技術の完全なレイアウトを公開

Wikipedia+巨大模型で幻想を破れ！スタンフォードWikiChatはGPT-4を上回り、精度は97.3%

ロボットとIoTがサプライチェーンに与える影響

「汎用人工知能」を実現するには？ LSTMの著者の一人、Sepp Hochreiter: シンボリックAIとニューラルAIの融合

ロボティック・プロセス・オートメーション技術の需要が急増

張亜琴氏と張宏江氏は人工知能の将来について何を語っているのでしょうか?

人工知能は教育の未来を変える：私たちをより賢くする