機械学習の3つの時代におけるコンピューティングのトレンド

機械学習の3つの時代におけるコンピューティングのトレンド

2010 年以前は、トレーニング コンピューティングの開発はムーアの法則に沿って 2 年ごとに 2 倍に増加していましたが、2010 年代初頭にディープラーニングが導入されて以来、トレーニング コンピューティングのペースは加速し、約 6 か月ごとに 2 倍に増加しています。2015 年末には、新しいトレンドが出現しました。

これらの観察に基づいて、機械学習の計算の歴史は、ディープラーニング以前の時代、ディープラーニングの時代、大規模時代の 3 つの時代に分けられています。この記事では、高度な機械学習システムをトレーニングするための急速に増大する計算要件についてまとめています。

傾向

比較は、トレーニングに必要な計算量が注釈付けされた 123 の画期的な機械学習システムで構成されるデータセットで実行されました。ディープラーニングが普及するまでは進歩が遅い時期がありましたが、2010 年にその傾向は加速し、それ以降は減速していません。さらに、2015年と2016年には、大規模モデルへの新たなトレンドが生まれ、以前の時代よりも2桁速い速度で拡大しました。

ディープラーニングへの移行 ディープラーニングの登場前と登場後には、2 つの異なるトレンド メカニズムが見られました。

これまで、機械学習アルゴリズムのトレーニングに必要な計算能力は、17 ~ 29 か月ごとに 2 倍になっていました。その後、全体的な傾向は加速し、4~9 か月ごとに 2 倍になりました。

ムーアの法則によれば、トランジスタ密度は 2 年ごとに 2 倍になります (Moore、1965)。これは、コンピューティング パフォーマンスが 2 年ごとに 2 倍になると簡略化されることが多く、基本的にはディープラーニング以前の時代の傾向と一致します。ディープラーニングの時代がいつ始まったのかは明らかではなく、ディープラーニング以前からディープラーニングの時代への移行に明らかな断絶はありません。さらに、ディープラーニングの時代が 2010 年に始まったか 2012 年に始まったかによって、結果はほとんど変わらなかったでしょう。

巨大深海時代の動向

データによると、大規模モデルの新しいトレンドは 2015 年から 2016 年に始まったようです。この新しいトレンドは 2015 年末の AlphaGo から始まり、現在まで続いています。大規模モデルは大企業によってトレーニングされています。トレーニング予算の増加が、以前のトレンドを打破した理由かもしれません。

また、レギュラーサイズモデルの人気は影響を受けておらず、2016年以前と以後の傾向は同じで、下表の通り5~6か月ごとに倍増しています。大規模モデルの計算能力の増加傾向は大幅に鈍化し、9 ~ 10 か月ごとに 2 倍になっています。これらのモデルで利用できるデータは限られているため、見かけ上の速度低下はノイズによるものである可能性があります。

この発見は、2012年から2018年までの倍増期間が3.4か月であると発見したAmodei & Hernandez (2018)や、2018年から2020年までの倍増期間が2年以上であると発見したLyzhov (2021)とは対照的です。大規模な傾向はごく最近になって発生したため、以前の評価ではこれら 2 つの異なるパターンを区別できませんでした。

結論は

この結果は、トレーニング計算のサイズがより控えめであることを示した以前の研究と一致しています。 1952年から2010年までは倍増に18か月かかり、2010年から2022年までは倍増に6か月かかり、2015年後半から2022年にかけての大規模な新たな傾向は2~3桁速く、倍増に10か月かかります。

要約すると、ディープラーニング以前の時代ではコンピューティングの進歩は遅かったが、2010 年のディープラーニング時代の到来とともにこの傾向は加速した。 2015 年後半、企業は AlphaGo などトレンドを上回るパフォーマンスを発揮する大規模モデルの開発を開始し、規模の時代の幕開けとなりました。ただし、これでは、パターンを形成するための大規模モデルと通常規模のモデルを明確に区別するものではありません。

コンピュータ教育におけるハードウェア インフラストラクチャとエンジニアの役割が増大していることから、両者の戦略的必要性が浮き彫りになっています。大規模なコンピューティング予算やコンピューティング クラスターへのアクセス、およびそれらを適用するための専門知識は、最先端の機械学習研究と同義になっています。


<<:  すべてがAI+になる新しい形の人工知能があなたを待っています

>>:  量子コンピューティングとブロックチェーンの未来

ブログ    
ブログ    
ブログ    

推薦する

...

STLコンポーネントアルゴリズム

STL は、OOP と従来のプログラミングの両方で使用できる多数のテンプレート クラスと関数を提供し...

...

...

言語モデルは時間をどのように認識するのでしょうか?時間ベクトルについてさらに詳しく

言語モデルは正確にはどのようにして時間を認識するのでしょうか?言語モデルの時間認識をどのように利用す...

マテリアル界のImageNet、大規模6次元マテリアル実写データベースOpenSVBRDFを公開

計算グラフィックス分野では、マテリアルの外観は、実際のオブジェクトと光の間の複雑な物理的相互作用を表...

このAIは、監視対象を素早く検索するのに役立ちます:テキスト配置キーフレーム、24時間のビデオ録画10分処理

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

企業が人工知能を導入する際に知っておくべき5つの誤解

[[392106]] AI は広く普及しているにもかかわらず、知識と認識のギャップにより、商業的な導...

...

地下鉄乗車時の「顔認識」:AI専門家にとって新たな金鉱

[[276754]]業界のすべての実務者が合意に達することはまれですが、AI業界は例外です。ほぼすべ...

...

張北院士:人工知能の一般理論が形成されつつあり、AI革命の発展は止められない

7月6日に開催されたAscend人工知能産業サミットフォーラム2023において、中国科学院院士、清華...

AIが継続的にモンスターと戦い、アップグレードできるようにするために、DeepMindは「メタバース」を作成した。

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

AI医用画像の春が再び到来?

概要: AI医用画像診断市場は急速な成長期を迎えつつあり、医師の負担を軽減しながら医療の質の向上も期...

スマートロボットについて知っておくべきことすべて

スマートロボットは、タスクをより効率的かつ正確に実行し、生産性を向上させ、人的エラーを削減するように...