このツールは、テンソルの形状エラーを数秒で検出し、ML モデルのトレーニングが無駄になるのを防ぐことができます。

このツールは、テンソルの形状エラーを数秒で検出し、ML モデルのトレーニングが無駄になるのを防ぐことができます。

[[442491]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

長い時間をかけてモデルをトレーニングした結果、テンソルの形状が誤って定義されていることが判明したのは、きっとイライラしたことでしょう。

では、この状況に対するより良い解決策はあるのでしょうか?

最近、韓国のソウル国立大学の研究者らが「強力なツール」であるPyTeaを開発しました。

研究者によると、モデルをトレーニングする前に、数秒以内に潜在的なテンソル形状エラーを静的に分析するのに役立つとのことです。

では、PyTea はどのようにそれを実現するのでしょうか? 信頼できるのでしょうか? 調べてみましょう。

PyTeaが誕生した経緯

テンソルの形状が間違っているとなぜ問題になるのでしょうか?

ニューラル ネットワークには一連の行列計算が含まれます。前の行列の列数は、次の行列の行数と一致している必要があります。次元が一致しないと、後続の操作は実行できません。

上記のコードは典型的なテンソル形状エラーです。[B x 120] * [80 x 10] は行列演算を実行できません。

PyTorch、TensorFlow、Keras のいずれであっても、ニューラル ネットワークをトレーニングするときには、そのほとんどはグラフのプロセスに従います。

まず、一連のニューラル ネットワーク レイヤー (つまり、マトリックス) を定義し、次にニューラル ネットワーク モジュールを合成します...

では、なぜ PyTea が必要なのでしょうか?

以前は、モデルが大量のデータを読み取り、トレーニングを開始し、コードが間違ったテンソルに対して実行された場合にのみ、テンソルの形状定義のエラーが発見されました。

モデルは非常に複雑で、トレーニング データは非常に大きいため、エラーを発見するための時間コストは非常に高くなります。コードがバックグラウンドでトレーニング用に残され、何か問題が発生しても誰も気付かないこともあります...

PyTea は、モデル コードを実行する前に形状エラーを分析できるため、この問題を効果的に回避できます。

ネットユーザーの間ではすでに熱い議論が巻き起こっている。

PyTea はどのように機能し、エラーを効果的に検出できますか?

さまざまな制約の影響を受け、コード実行パスは多数存在し、データによってパスも異なります。

したがって、PyTea は、すべての可能な実行パスを静的にスキャンし、テンソルの変更を追跡し、各テンソルの形状の正確で保守的な範囲を推測する必要があります。

上の図は PyTea の全体的なアーキテクチャを示しており、言語の翻訳制約の収集ソルバーの判断フィードバックの 4 つのステップに分かれています。

まず、PyTea は元の Python コードをカーネル言語に変換します。 PyTea 内部表現 (PyTea IR)。

次に、PyTea は PyTea IR の可能なすべての実行パスをトレースし、テンソルの形状に関する制約を収集します。

制約が満たされているかどうかの判断は、オンライン分析オフライン分析の2つのステップに分かれています。

  • node.js (TypeScript/JavaScript) のオンライン プロファイリング: テンソル シェイプ値の不一致と API 関数の誤用を検出します。 PyTea は問題を発見すると、現在の場所で停止し、ユーザーにエラーを報告します。
  • オフライン分析 Z3/Python: オンライン分析に問題がない場合、PyTea は収集された制約を SMT (Satisfiability Modulo Theories) ソルバー Z3 に渡します。ソルバーは、各パスの制約が満たされるかどうかを確認する役割を担います。満たされない場合は、最初のエラー パスの制約をユーザーに返します。

ソルバーが長時間沈黙していると、PyTea は問題があるかどうかを認識せずに返します。

しかし、すべての可能なパスを追跡するのは指数関数的な作業であり、複雑なニューラル ネットワークではパス爆発の問題が必ず発生します。

たとえば、この例では、ネットワークの最終的な構造は 24 個の同一モジュール ブロック (行 17) で構成されているため、可能なパスは最大1600 万通りあります。

したがって、パス爆発に対処する必要があります。PyTea はこれをどのように行うのでしょうか?

PyTea は、このパスの爆発的増加に対処するために、保守的なパスのプルーニングとタイムアウトの判断を選択します。

どのようなパスを剪定できますか?

PyTea が出した答えは、フィードフォワード関数がグローバル値を変更せず、その出力値が分岐条件の影響を受けず、各パスで等しい場合、完全に同一のパスを多数無視して計算リソースを節約できるというものです。

それでもパス プルーニングが機能しない場合は、タイムアウトとしてのみ処理できます。

原則はこれですべてです。試してみる価値はあると思います。コードは現在 GitHub でオープンソースになっています。ぜひチェックしてみてください。

使い方

依存関係:

インストール方法:

次のコマンドを実行します:

<<:  3 つの質問、7 人の CXO、「自動運転」に関するブレインストーミング

>>:  PyTorch | ニューラル ネットワークのトレーニングを最適化する 17 の方法

ブログ    

推薦する

GPUベースの人工知能と機械学習アプリケーション

[51CTO.com クイック翻訳]今日、グラフィックス プロセッシング ユニット (GPU) は、...

国防総省は、今後数日間の出来事を予測するために人工知能を活用している。

海外メディアCNETによると、米軍はビッグデータと人工知能を活用して近い将来の出来事を予測しようとし...

将来のビジネスインテリジェンスにおける人工知能の役割

AI 搭載のチャットボットを導入しているコールセンターから、ディープラーニングを使用して数え切れない...

...

AI開発者のための7つの倫理ガイドライン

人工知能はここ数年で大きな進歩を遂げました。 AIテクノロジーで生み出されるソリューションは想像を絶...

中国の自動運転が新たなブレークスルーをもたらす:百度世界2020のCCTV生中継で完全無人運転を体験

中国の自動運転は新たな進歩を遂げ、無人運転の時代が到来した。 9月15日、百度はCCTVニュースと提...

...

機械学習モデルは展開するには大きすぎますか? 3つの解決策をご紹介します

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

わかりやすく解説: 機械学習と統計モデリングの違い

これらは互いに大きく異なっており、すべてのデータ サイエンティストはその理由と方法を理解する必要があ...

人工知能は多くの仕事を置き換えるでしょう。将来の子供たちの競争力は成績とは全く関係ないかもしれません。

[[379145]]昨日、家で強宝と一緒に『様々な職業』という本を読んでいました。突然思いついて、...

Googleの新しいAIツールはAppleのバッチ処理ツールに似ている

プライバシーを保護するために、Google は「フェデレーテッド ラーニング」テクノロジーを活用して...

Julia vs Python: 2019 年に機械学習でナンバー 1 になるプログラミング言語はどれでしょうか?

[[252207]] [51CTO.com クイック翻訳] Juliaは2018年に登場し、現在最...

オープンソースのラマ2の背後には、若い中国人たちの力がある

最近、Llama 2 のオープン ソース化により、Yann LeCun 氏や業界関係者の多くが「ビッ...

アメリカの企業は単純なタスクを処理するためにAIを活用することに熱心だが、若者にはトレーニングや開発の機会が不足している

7月18日のニュース、Businessinsiderによると、米国の若い労働者はキャリア危機に直面し...

...