再トレーニングなしでモデルを6倍圧縮:数学者チームが新しい量子化法を提案

再トレーニングなしでモデルを6倍圧縮:数学者チームが新しい量子化法を提案

RUDN大学の数学者チームは、再トレーニングに余分なリソースを費やすことなく、ニューラルネットワークのサイズを6分の1に縮小できる新しい方法を発見しました。

ニューラル ネットワークの圧縮とは、ニューラル ネットワークのパフォーマンスに大きな影響を与えずに、適切な方法によってネットワークのパラメーターとストレージ スペースを削減することを指します。これは、近似、量子化、およびプルーニングの 3 つのカテゴリに大別できます。

ロシア人民友好大学(RUDN)の数学者チームは、再トレーニングに追加のリソースを費やすことなく、トレーニング済みのニューラルネットワークのサイズを6分の1に縮小する方法を発見した。この方法は、初期システムとその簡略化されたバージョンにおけるニューラル接続の重み間の相関関係を見つけることに基づいています。この研究の結果は「Optical Memory and Neural Networks」誌に掲載されました。

人工ニューラルネットワークと生体内のニューロンの構造は同じ原理に基づいています。ネットワーク内のノードは相互接続されており、一部のノードは信号を受信し、一部のノードはチェーン内の次の要素をアクティブ化または抑制することによって信号を送信します。画像や音声などの信号を処理するには、多くのネットワーク要素とそれらの間の接続が必要です。ただし、コンピュータ モデルにはモデル容量とストレージ スペースが限られています。大量のデータを処理するために、この分野の研究者は、いわゆる量子化を含む、モデルのパワーに対する要求を軽減するさまざまな方法を発明する必要がありました。これにより、リソースの消費量は削減されますが、システムの再トレーニングが必要になります。 RUDN 大学の一部の数学者は、後者は回避できることを発見しました。

「数年前、私たちはホップフィールド ネットワークで効果的かつコスト効率の高い重み量子化を実行しました。これは、ヘブの規則に従って形成された要素間の対称的な接続を持つ連想記憶ネットワークです。動作中、ネットワークのアクティビティは特定の平衡状態にまで低下し、この状態に達するとタスクは解決されたとみなされます。この研究で得られた洞察は、後に、今日の画像認識で非常に人気のあるフィードフォワード ディープラーニング ネットワークに適用されました。通常、これらのネットワークは量子化後に再トレーニングする必要がありますが、私たちは再トレーニングを回避する方法を見つけました」と、RUDN 大学のニコルスキー数学研究所の助教授である Iakov Karandashev 博士は述べています。

人工ニューラル ネットワークを簡素化する主な考え方は、重みあたりのビット数を削減するという、いわゆる重み量子化です。量子化は信号の平均化を提供します。たとえば、これを画像に適用すると、同じ色の異なる色合いを表すすべてのピクセルが同一になります。数学的には、これは、特定のパラメータを持つ類似の神経接続は同じ重み (または重要度) を持ち、同じ数値で表される必要があることを意味します。

RUDN大学の数学者チームが計算を行い、量子化の前後のニューラル ネットワークの重み間の相関関係を効果的に確立する数式を作成しました。これを基に、科学者たちは訓練されたニューラルネットワークが画像を分類できるアルゴリズムを開発しました。この研究の実験では、数学者らは1,000のグループに分けられる50,000枚の写真を含むデータセットを使用した。トレーニング後、ネットワークは新しい方法を使用して量子化され、再トレーニングは行われません。次に、この研究では実験結果を他の量子化アルゴリズムと比較しました。

RUDN 大学の Iakov Karandashev 氏は次のように付け加えています。「量子化後、分類精度はわずか 1% 低下しましたが、必要なストレージ容量は 6 分の 1 に削減されました。実験では、初期重みと量子化された重みの間に強い相関関係があるため、ネットワークを再トレーニングする必要がないことが示されました。このアプローチは、時間に敏感なタスクを完了する場合や、モバイル デバイスでタスクを実行する場合にリソースを節約するのに役立ちます。」

<<:  教師なしトレーニング用のスタック型オートエンコーダは時代遅れですか? ML博士が8つのオートエンコーダを比較

>>:  90年代のアンティークコンピューターでCNNをトレーニングしました

ブログ    
ブログ    
ブログ    

推薦する

旅の途中で「おもしろさ」が爆発!絵文字ジェネレーター、マスクがプリンセスに変身 | チュートリアル付き

Midjourney 5.2 はちょうど 1 週間前にリリースされ、さらに大きなアップデートが行われ...

...

2020 年のディープラーニングに最適な GPU の概要。どれが最適かを確認してください。

ビッグデータダイジェスト制作出典: lambdalabs編纂者:張秋月ディープラーニング モデルが強...

解雇はランダムに行われますか? Googleの上級エンジニアが従業員が抗議活動を準備していることを明らかに

「グーグルには現在、先見の明のあるリーダーはいない。経営陣から上級副社長、副社長に至るまで、彼らは皆...

OpenAI: ニューヨークタイムズは私を攻撃するためにハッカーを雇った

新聞社が雇ったハッカーが AI の巨人を攻撃するのはなぜでしょうか?ニューヨーク・タイムズがOpen...

ダボにおけるタイムホイールアルゴリズムの応用

[[346568]] 1 スケジュールされたタスクNetty、Quartz、Kafka、Linux ...

高度な分析とコンピューティング技術の出現が世界のインテリジェントアプリケーション市場を牽引

世界的なスマート アプリケーション市場の成長は、高度なコンピューティングおよび分析テクノロジによって...

人工知能の時代では、科学技術分野の人材は職を失うのでしょうか?

インターネット技術の発展、ビッグデータや人工知能技術の進歩により、一部の伝統的な産業は革命的な変化を...

機械学習:教師あり学習と教師なし学習の違いは何ですか?

機械学習は、例と経験を通じてコン​​ピューターにタスクの実行を教える人工知能のサブセットであり、研究...

...

顔認識に関する国家基準が策定中:顔のスキャンは許可されず、検証後にデータは削除される必要がある

近年、顔認識技術が急速に発展し、顔をスキャンするだけで高速鉄道駅に入ることができるので非常に便利です...

AES暗号化アルゴリズムの強度が弱まった

この脆弱性は、広範囲にわたる暗号分析を行った3つの大学とマイクロソフトの研究者によって発見されたが、...

1万語の要約 | 2023年のビッグモデルと自動運転の論文を簡単に見る

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

革新的なマイクロチップ設計によりコンピューティングがエッジにまで広がり、AIをリアルタイムで使用できるようになります。

人工知能によるコンピュータネットワークへの需要の爆発的な増加に対処するため、プリンストン大学の研究者...

AIが疫病と闘う:国家AIパイロットゾーンがその実力を発揮

ウイルス分析、ワクチン開発、医薬品研究開発から診断支援、スマート温度測定、AI消毒まで…新型コロナウ...