驚きですか、それともショックですか?機械学習アルゴリズムの「高エネルギー」な瞬間を評価する

驚きですか、それともショックですか?機械学習アルゴリズムの「高エネルギー」な瞬間を評価する

編集者注: 「水は船を運ぶこともできるが、転覆させることもできる。」この古いことわざは、誰もが知っていると思います。機械学習に適用すると、多くの利便性をもたらす機械学習アルゴリズムは、注意しないと、予期しない理由で「驚き」をもたらす可能性があります。この現象について論じた論文を原著者が解釈し、Leifeng.com AI Technology Reviewが以下のようにまとめました。

機械学習アルゴリズムは他のコンピュータ プログラムとは大きく異なります。通常のプログラミングでは、人間のプログラマーがコンピューターに何をすべきかを指示します。機械学習では、人間のプログラマーは単に問題を提示するだけで、アルゴリズムは試行錯誤を通じてその問題を解決する方法を見つけ出す必要があります。

これまでのところ、このアプローチは非常に効果的であるように思われます。機械学習アルゴリズムはすでに、顔認識、言語翻訳、金融モデリング、画像認識、広告などで広く使用されています。これまでオンラインになったことがあるなら、おそらく機械学習アルゴリズムとやり取りしたことがあるでしょう。

しかし、必ずしもうまくいくとは限りません。プログラマーは、自分のアルゴリズムは十分にうまく設計されていると考えていても、結果を詳しく調べると、プログラマーが当初考えていた問題とはまったく異なる問題を解決していることに気付くことがあります。たとえば、羊を認識するはずだった画像認識アルゴリズムが、最終的には草を認識するように学習してしまい、何もない緑の草原に羊がいるとラベル付けし続けたのを見たことがあります。

緑豊かな丘陵で草を食む羊の群れ

タグ: 放牧、羊、山、城、馬

機械学習アルゴリズムが予期せぬ方法で問題を解決すると、プログラマーは、確かにイライラすることもあるが、純粋な喜びを感じることが多いと感じます。

驚いたことに、2018年に研究者グループがこれに基づいて興味深い論文を執筆しました。その論文には、「研究者の間で驚きと賞賛を引き起こした」数十の逸話が集められていました。この論文は、原文の参考文献も含めて一読する価値が十分あります。ここでは、私のお気に入りの例をいくつか紹介します。

論文リンク: https://arxiv.org/pdf/1803.03453.pdf

勝つためにはルールを曲げる必要がある!

まず、ロボットの動きに新しいアイデアを提供することも含め、生物をシミュレートすることでさまざまな運動形態がどのように進化したかを研究する長い伝統があります。

羽ばたくことができるのに、なぜ歩くのでしょうか? この例では、シミュレートされたロボットはできるだけ速く前進するはずでしたが、脚を進化させる代わりに、自ら塔を作り上げ、その後倒れてしまいました。ロボットの中には、落下を宙返りに変えて飛距離を稼ぐことを学んだものもあった。

【写真:ロボットが倒れた塔になった】

ただ跳ねればいいのに、なぜジャンプの仕方を学ぶ必要があるのでしょうか? このシミュレートされたロボットのセットは、ジャンプできる形に進化するはずでしたが、プログラマーが最初にジャンプの高さを上部のブロックの高さに設定していたため (これもまた愚かなことですが)、ロボットは非常に背の高い形になってしまいました。この問題を解決するために、プログラマーはジャンプの高さを最初の停止の高さとして定義しようとしました。それに応じて、ロボットは長くて細い脚を進化させ、足を空中に蹴り上げることができるカンカンロボットに変形しました。

[写真: 背の高いロボットはジャンプする代わりに足を空中に伸ばします]

「超エネルギー」のためなら、一切の妥協なしで脅迫します!

シミュレーションロボットが活用することを学ぶエネルギー源は、位置エネルギーだけではありません。現実世界で起こるのと同じように、使用可能なエネルギーが存在すると、何かがそれを利用するために進化することがわかります。

浮動小数点の丸め誤差をエネルギーとして利用:あるシミュレーションでは、ロボットは数学における丸め誤差のルールを学習し、これにより移動中に余分なエネルギーを得られることを発見しました。そこで彼らは素早く動くことを学び、それによって利用できる自由エネルギーを大量に生み出しました。プログラマーたちは、ロボットが驚くべきスピードで泳ぎ始めたときに初めて問題に気づいた。

床との衝突によるエネルギーの捕捉:別のシミュレーションでは、衝突検出ルールを学習したロボットが別の問題を提起しました。ロボットが床に落ち着くと(そもそも時間の操作を学習することでこれが可能になる)、衝突検出システムはロボットが床に落ちるべきではないことを認識し、ロボットを上方に撃ちます。その後、ロボットは床に対して急速に振動し、繰り返し衝突することで余分なエネルギーを生成することを学習しました。

[画像: ロボットは床からの振動を利用して推進力を生み出す]

「衝突」飛行:別のシミュレーションでは、ジャンプするロボットが、飛行を助けるためにさまざまな衝突検出バグを利用することを学習しました。ロボットの部品が互いに接触すると、その力によってロボットが空中に押し上げられます。もしこれが現実に機能するなら、今日の商業飛行は違ったものになるだろう。

「抜け穴」の悪用:コンピュータ ゲームのアルゴリズムは、人間が勝利速度を上げるためによく利用するマトリックスの不具合を見つけるのが非常に得意です。古い Atari ゲーム Q*bert をプレイする機械アルゴリズムは、レベルの終了時に次のレベルに直接移行するのではなく、特定の一連のアクションを実行することを選択するという、これまで発見されていなかったバグを発見しました。これにより、すべてのプラットフォームが急速に点滅し始め、プレーヤーが大量のポイントを獲得できるようになります。

Doom に焦点を当てた別のアルゴリズムも、敵が火の玉を撃つのを防ぐことができる特別な操作を発見しましたが、それはアルゴリズムの Doom の「夢のバージョン」でのみ機能しました。良いニュースは、そのバージョンのゲームをここでプレイできることです。

ゲームリンク: https://worldmodels.github.io

[写真: Q*bert プレイヤーは、大したことではないのに、疑わしいほどのポイントを獲得している]

「大きな目標」:恐ろしい例として、航空母艦に着陸しようとする飛行機に最小の力を加える方法を解くはずだったアルゴリズムが、「大きな」力を加えるとプログラムのメモリがオーバーフローし、非常に「小さな」力として記録されることを発見しました。パイロットは死ぬだろうが、まあ、とりあえず得点してみよう。

破壊もまた解決策だ!

リストソートアルゴリズムのように一見無害なものでも、無害でありながらも邪悪な方法で問題を解決することがあります。

ご存知のとおり、それらは「未ソート」ではありません。たとえば、数値のリストをソートすることを学習するはずのアルゴリズムは、実際には「未ソート」のものを技術的に排除するためにリストを削除することを学習します。

小林丸テストの完了:アルゴリズムは、自身の回答と正解の差を最小限に抑えるはずでしたが、回答を保存して削除する場所を見つけたため、満点を獲得しました。

三目並べで勝つ: 1997 年に、何人かのプログラマーが、可能な限り大きなボード上で三目並べを対戦できるアルゴリズムを構築しました。プログラマーは、特定のアルゴリズム戦略の設計を放棄し、それを独自に開発させることにしました。誰もが驚いたことに、アルゴリズムは突然すべてのゲームに勝ち始めました。アルゴリズムの戦略は、ピースを極端に離して配置することであり、そのため、対戦相手のコンピューターが新しい拡張をシミュレートしようとするたびに、ゲームボードが大きすぎるためにメモリが不足してクラッシュし、ゲームに負けることになります。

結論は

機械学習が問題を解決するとき、導き出される解決策は巧妙なものになる場合もあれば、まったく奇妙なものになる場合もあります。

これが進化の仕組みです。生物学者なら誰でも言うように、生物は常に問題に対する最も奇妙な解決策と、活用できる最も奇妙なエネルギー源を見つけます。我々がコンピューターシミュレーションの中で生きているのではないことを示す最も確かな兆候の一つは、もしそうだとしたら、一部の微生物がその欠陥を利用することを学ぶだろうということだ。

したがって、プログラマーとして、私たちはアルゴリズムが要求された問題を解決し、近道をとらないように細心の注意を払う必要があります。問題をより簡単に解決する別の方法があれば、機械学習がそれを見つける可能性が高いでしょう。

幸いなことに、「すべての人間を殺す」というのは本当に難しいことです。 「信じられないほどおいしいケーキを焼く」ことも問題を解決し、「すべての人間を殺す」よりも簡単であれば、機械学習は間違いなくケーキの側を選択します。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

<<:  インペリアル・カレッジ:専門医の80%が懸念する心臓リズムデバイスインプラント手術問題をAIで解決する方法

>>:  素晴らしい:テスラの AI ディレクターであり、リー・フェイフェイの弟子であるカルパシーの 33 のニューラル ネットワーク「錬金術」テクニック

ブログ    
ブログ    
ブログ    

推薦する

Redis に基づく分散ロックと Redlock アルゴリズム

[[403381]]この記事はWeChatの公開アカウント「UP Technology Contro...

2021 年のテクノロジートレンドはどこに向かうのでしょうか? IEEEが答えを教えます

[[357414]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...

DAMOアカデミーが最新の量子コンピューティングの成果を発表、新しいプラットフォームは2ビットゲート精度99.72%を達成

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

...

楽観主義と悲観主義の議論は無意味。AIに必要なのは開発モデルについて考えることだ

最近、烏鎮での夕食会で大物たちが何を食べたかという噂に加え、インターネット会議では人工知能に関する一...

インテリジェントな運用とメンテナンスからスマートな運用まで、Qingchuang Technologyは企業に探偵シャーロックの能力を提供します

[51CTO.com からのオリジナル記事] 運用保守作業は、初期の手動運用保守から自動化運用保守、...

人工知能は非常に強力だが、人間は必ずしも人工知能に支配されるわけではない。ホーキングは間違っているのだろうか?

著者: ふす有名な物理学者ホーキング博士はかつて、将来人類は人工知能によって滅ぼされるかもしれないの...

7つの機械学習アルゴリズムの7つの重要なポイント

さまざまなライブラリとフレームワークの助けを借りて、たった 1 行のコードで機械学習アルゴリズムを実...

Angel: 新しい分散型機械学習システム

Angel は、パラメータ サーバーの概念に基づいた分散型機械学習フレームワークであり、機械学習アル...

...

...

ルカン氏の論文は「盗作」と非難されたのか? LSTMの父は怒りの投稿を投稿しました:私をコピーした人はオリジナルにもマークを付けてください

チューリング賞を受賞したヤン・ルカンは、AI分野の三大巨頭の一人です。当然ながら、彼が発表した論文は...

テレンス・タオ:私の数学的経験に基づくと、室温超伝導LK-99とその再現は非常に刺激的です

昨今、室温超伝導の再現に対する世界的な熱気は衰えを知らず、さまざまな有力者が自らの見解を表明している...