この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 どのようなバグが Pytorch ライブラリの95% に影響を及ぼし、 Tesla の AI ディレクターにさえ問題を引き起こす可能性があるのでしょうか? この虫は確かに小さいですが、かなり「狡猾」です。 これは最近 Reddit で話題になっています。ネットユーザーが一般的なPytorch+Numpy の組み合わせを使用しているときにこれを発見しました。 最も重要なことは、コードがスムーズに実行できたとしても、モデルの精度に影響するということです。 さらに、ネットユーザーの間で熱く議論されたもう一つのポイントは次の通り。
何が起こっているのか?この事件の原因は、PyTorchでNumPyを使用して乱数を生成する際に、データの前処理の制限により、複数のプロセスがデータを並列にロードするが、最終的に各プロセスから返される乱数は同じになることをネットユーザーが発見したことでした。 彼はまた、自分の主張を裏付ける例も挙げた。 以下は、3 つの要素のランダムなベクトルを返すデータセットの例です。ここで使用されるバッチ サイズは 2 で、ワーカー プロセスの数は 4 です。 すると、不思議なことが起こりました。各プロセスによって返される乱数が同じになったのです。 この結果は本当にわかりにくいです。ちょうど、Xiao Ming が特定の距離を歩くのにどれくらい時間がかかるかを尋ねる数学の文章題で、計算すると負の数になるようなものです。 この問題を発見した後、ネットユーザーはGitHubから10万個以上のPyTorchライブラリをダウンロードし、同じ方法を使って乱数を生成した。 結果はさらに衝撃的で、 95% 以上のライブラリがこの問題に悩まされています。 その中には、PyTorch の公式チュートリアルや OpenAI のコードも含まれています。Tesla AI ディレクターの Karpathy 氏でさえ、「騙された」と認めています。 しかし、正直に言うと、このバグを解決するのは難しくありません。各エポックでシードをリセットするか、 Python の組み込み乱数ジェネレーターを使用してこの問題を回避します。 それはバグですか?この問題はすでに解決できるのに、なぜこれほど大きな議論を呼んでいるのでしょうか? ネットユーザーの注目が「哲学的」なレベルにまで高まったからだ。 これはバグですか? Reddit の誰かがこう考えました: これはバグではありません。
この見解が大きな騒動を引き起こし、多くの人が彼が問題の核心を見落としていると考えました。
別のネットユーザーも、このバグは実際にはデフォルトのプログラムで実行している場合にのみ発生するため、より多くのユーザーに指摘されるべきだと述べた。 そして、Pytorch ライブラリの 95% 以上がこれに悩まされていますが、これは決して誇張ではありません。 ある人は、以前の辛い経験を次のように話しました。
また、95% 以上のユーザーが使用時にエラーを経験する場合、コードが間違っていると付け加えたユーザーもいます。
PyTorch で落とし穴に遭遇したことがありますか?上記のバグは偶然ではありません。PyTorch を使用する人が増えるにつれて、バグもどんどん発見されます。ある Web サイトには PyTorch の落とし穴をまとめた記事もあり、49 万回も閲覧されています。 ベクトル、関数から model.train() まで、それが実際のバグであるか、自ら招いたバグであるかにかかわらず、誰もが経験する血と涙の物語は本当に異なります。 それで、PyTorch での経験について、共有できる血と涙の物語はありますか? |
<<: 音声認識技術は急速に発展しており、その規模は今後5年間で300億近くに達するだろう。
>>: アルゴリズムから離れた「ジレンマ」に直面し、専門家はシナリオベースの洗練されたガバナンスの実行を提案している。
2か月前にFacebookのザッカーバーグとテスラのマスクがAIをめぐって口論したことから、ちょうど...
業界に「金儲けの見込み」があれば、必然的に「混乱」が起こります。 10年前はスマートフォンでしたが、...
最近、外国メディアは複数の情報筋の話として、トランプ大統領は自動運転技術を承認していないと報じた。ト...
AI はこれまでに開発された最も強力なテクノロジーの 1 つですが、すでに 4 回の進化を経ています...
「国内の自主自動車運行システムを全面的に開放する。」 Leiphone.com(公式アカウント:Le...
ベルギーの通信会社は、10代の若者向けに「.comdom」というセキュリティアプリをリリースした。こ...
AI は、米国が戦争を戦い、脅威を監視し、国防を維持する方法を含め、ほぼすべてのことを行う方法を変え...
[[91338]] HTML5 がリリースされてから長い時間が経ちますが、日々の仕事や個人の Web...
ご存知のとおり、オープンソースの大規模言語モデル (LLM) とその派生モデル (LLaMA や V...
新興テクノロジーが世界を席巻し、前例のない革新、機会、脅威をもたらしています。これらの分野における専...
[[278276]]中小企業から大企業まで、ほぼすべての企業が顧客の注目を集める機会を求めて競争して...
人工知能 (AI) はまだ初期段階ですが、AI は急速に企業が自らを守るための重要な手段になりつつあ...
国連の統計によると、私たちが住む地球上には西暦8世紀以降、2万以上の人間の言語が出現しましたが、今日...