GoogleはAIチップに出産を学習させ、次世代のTPUはAI自身によって設計される

GoogleはAIチップに出産を学習させ、次世代のTPUはAI自身によって設計される

[[405016]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

AIチップの設計はどれくらい難しいのでしょうか?

こう言いましょう。囲碁の複雑さは 10360 ですが、チップは 102500 です。ちょっと考えてみましょう...

△囲碁の複雑さ

一般的に、エンジニアがチップを設計するには数週間から数か月かかります。

今、AI による生産性向上がここにあります!

AIはわずか6時間で独自にチップを設計しました。

最近、この Google の研究が Nature 誌に掲載されました。

レイアウト時間が数倍短縮

小さなチップには数十億個のトランジスタが含まれており、それらで構成される数千万個の論理ゲートが標準ユニットであり、マクロブロックと呼ばれる数千個のストレージブロックもあります。

それらの位置、つまりフロアプランを決定することは、チップ設計にとって非常に重要です。

これは配線方法に直接関係しており、チップの処理速度と電力効率に影響します。

ただし、マクロブロックの配置手順だけでも非常に時間がかかり、標準セル用のスペースを増やすために各反復に数日または数週間かかります。

△人間が設計したチップとAIが設計したチップの平面図(灰色のブロックはマクロブロック)

レイアウト全体を完成させるには、数週間から数か月かかることもあります。

現在、Google の研究者は、一般化できるチップレイアウト方法を提案しています。

深層強化学習に基づいて以前のレイアウトを学習し、新しいデザインを生成することができます。全体的なアーキテクチャは次のとおりです。

AIモデルは10万個のチップレイアウトを学習する必要があるため、速度を確保するために、研究者らは、配線の長さと配線の混雑度のおおよそのコスト関数に基づいて計算される報酬メカニズムを設計しました。

具体的には、マクロと標準セルをフラットなキャンバスにマッピングして、数百万から数十億のノードを持つ「チップ ネットリスト」を形成する必要があります。

次に、AI モデルは電力、パフォーマンス、面積 (PPA) などの要素を最適化し、確率分布を出力します。

次の図は、事前トレーニング戦略に基づくゼロサンプル生成と微調整の効果を示しています。各小さな四角形はマクロブロックを表しています。事前トレーニング戦略では、標準ユニットを配置するためのスペースが中央に残されています。

Google の新しいアプローチでは、他の方法と比較して設計時間が大幅に短縮され、パフォーマンスが最適化されたレイアウトを実現するのに6 時間もかかりません

Google: 効果は良好で使用済み

研究チームは、さまざまな戦略におけるレイアウト効果を視覚化しました。図から、事前トレーニング戦略を微調整した結果が、ゼロサンプル生成よりも大幅に優れていることがわかります。

さらに、異なるトレーニング期間の効果を比較すると、 2〜12時間のトレーニングの場合、事前トレーニング戦略はゼロサンプル生成よりも優れていることがわかります。

研究者たちは、さまざまなサイズのデータ​​セットでテストを行った結果、データセットのサイズが大きくなるにつれて、生成されるレイアウトの品質と収束時間の結果が向上することを発見しました。

グーグルはこう言った。

このアプローチは、あらゆるタイプのチップに適用できます。

現在、次世代の Google TPU(アクセラレータ チップ)の製造に使用されています。

<<:  業界アプリケーション: ドローンに正確な測位技術を提供するにはどうすればよいでしょうか?

>>:  ヘルスケアにおける人工知能の応用

ブログ    
ブログ    

推薦する

AIを使ってAIを攻撃する?敵対的機械学習に対する脅威と防御

人工知能 (AI) や機械学習 (ML) プロジェクトを適用する組織が増えるにつれて、これらのプロジ...

不確実な環境で自動運転を実現するにはどうすればよいでしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

脳コンピューターインターフェース技術は本当に人気がある

[[274622]]参加者は脳波計を装着し、コンピューターの画面を見つめながら、急速に点滅するターゲ...

データセンターから発電所まで: 人工知能がエネルギー利用に与える影響

人工知能 (AI) は急速に現代生活に欠かせないものとなり、産業を変革し、私たちの生活、仕事、コミュ...

Llama-2+Mistral+MPT=? 複数の異種大規模モデルの融合が驚くべき結果を示す

LLaMA や Mistral などの大規模言語モデルの成功により、大手企業やスタートアップ企業は独...

...

...

...

ブロックチェーン、人工知能…革新的なコンセプトを利用して投資家を混乱させる違法金融にご注意

[[337468]]最近、上海検察院は2019年金融検察白書を発表し、現在の金融犯罪事件を整理・分析...

ディープラーニングフレームワークFlashを使用して、わずか数行のコードで画像分類器を構築する方法

[[412621]] 【51CTO.com クイック翻訳】 1. はじめに画像分類は、画像がどのクラ...

企業に利益をもたらす 5 つの AI トレンド

市場の状況がますます複雑化する今日の不安定なビジネス環境では、組織が分析に基づく意思決定を行うために...

NetEase Cloud Musicのリアルタイムデータウェアハウスガバナンス最適化の実践

1. 現状と問題点1. 現状と問題点Cloud Music データ ウェアハウス プラットフォームは...

AI = ニューラルネットワーク?これら 8 つのテクニックはそうではありません!

[[226709]]ビッグデータ概要翻訳者:Fu Yiyang、Ding Hui、Aileen A...

顔認識禁止が迫る:テクノロジー企業はどこへ向かうべきか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...