行列の乗算は乗算を必要とせず、100倍高速化、MITが近似アルゴリズムをオープンソース化

行列の乗算は乗算を必要とせず、100倍高速化、MITが近似アルゴリズムをオープンソース化

[[421266]]

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

乗算と加算を行わずに行列の乗算を計算できますか?

行列の乗算には多数の a+b×c タイプの演算が含まれるため、乗算器と加算器が 1 つの計算ユニットに結合され、乗算と累算の演算が実行されることがよくあります。

近似アルゴリズムを使用する場合は、はい!

これはMITの最新の研究です。彼らは、一定の精度を確保しながら、既存の近似アルゴリズムの10倍の速度を実現する新しい近似アルゴリズムMADDNESSを提案しました。これは正確なアルゴリズムよりも100倍高速であり、 ICML 2021に含まれていました。

この研究では、新しいアルゴリズムは、スパース化や因数分解など最近人気の演算よりも有望である可能性があるとも考えています。

現在、作者はアルゴリズムのコードをオープンソース化しており、興味のある方は試してみることができます。

見てみましょう。

Kクラスタリングアルゴリズムを使用してルックアップテーブルを作成する

このアルゴリズムは、積量子化と呼ばれる手法を借用しています。

その中でも、量子化は本質的に近似演算です。

行列の乗算における各要素は 2 つのベクトルのドット積と見なすことができるため、多数の乗算演算を実行せずに類似のベクトルを見つけることで、ベクトルのドット積を近似的に推定できます。

積量子化の具体的な原理は次のとおりです。

計算対象のベクトルaを入力すると、関数g(·)はaに対して近似演算を実行し、事前に設定された数値参照テーブルからそれに最も近い値を見つけて、近似ベクトルg(a)を出力します。

同時に、このテーブルの各値は事前にドット積が計算されているため、g(a) を出力する際に​​、クエリベクトル b に対応するその近似ドット積計算結果 h(b) も参照して出力することができます。

最後に、乗算を必要とせずに g(a) と h(b) を加算するには、f(·,·) 関数を使用するだけです。

簡単に言えば、近似テーブル検索方式を使用することで、行列乗算における乗算計算時間が節約されます。

では、近似計算プロセス中に計算精度の低下を最小限に抑えるためには、このような数値参照テーブルにどのような値を設定すればよいのでしょうか。

ここでは、 K平均アルゴリズムの考え方を借用します。つまり、データをK個のグループに事前に分割し、K個のオブジェクトを初期クラスタリング センターとしてランダムに選択し、トレーニングを反復して、サンプルがK個のクラスに分割されたときに、各サンプルとそのクラスの中心間の距離の合計が最小化されるようにします。

△ 可視化されたKクラスタリングアルゴリズム

この方法で計算された数値参照テーブルは、行列乗算の数値計算結果をより正確に近似することができます。

このアイデアに基づいて、著者らは、単一の CPU で毎秒 100 GB を超えるデータをエンコードできる効率的なベクトル積量子化関数を提案しました。同時に、低ビット幅の整数に対する高速な合計関数も提案しました。

そして、これら 2 種類の関数に基づいて、新しい行列乗算アルゴリズム MADDNESS が開発されました。

この近似はどの程度機能するでしょうか?

精度は維持され、効率は数倍向上

このアルゴリズムに必要な計算能力は高くなく、Intel Core i7-4960HQ (2.6GHz) プロセッサを搭載したMacbook Proでも完了できます。

彼らは、CIFAR-10/100 データセットを使用して、VGG16 モデルの Keras バージョンでこれをテストし、さまざまな最先端の近似アルゴリズムを評価しました。

図から、効率が約10倍向上したにもかかわらず、MADDNESS(図の赤線)はCIFAR-10でほぼ変わらない精度を維持できることがわかります。

CIFAR-100でもMADDNESSとMADDNESS-PQは精度にほとんど変化がなく効率を最大化する結果を達成しています。

最新のアルゴリズムであることに加え、他の既存のアルゴリズム(著者らが2017年に提案したBoltアルゴリズムを含む)と比較しても、結果は非常に優れています。

計算速度を比較すると、MADNESS のドット積の速度は、既存の最速方式の約 2 倍の速さです。

もちろん、この論文にはまだ未解決の問題がいくつかあると指摘する読者もいました。

①論文ではVGG16モデルが使用されていますが、Transformer(BERTなど)などのより古典的なモデルでの実験は行われていません。 ②行列乗算は高速化されていますが、結局のところ近似アルゴリズムに過ぎず、精度が失われる可能性があります。 ③評価結果はGPUでテストされていません。

しかし、彼はそれでも、これは非常に興味深い研究だと考えています。

著者について

[[421267]]

高速機械学習アルゴリズムの開発に取り組んでいる MIT のコンピューターサイエンスの博士課程の学生、デイビス・ブラロック氏は、機械学習モデルを評価する上で速度が非常に重要な要素であると考えています。

[[421268]]

John Guttag 氏は、MIT のコンピューターサイエンス学部の教授です。彼の研究対象は、機械学習、AI、コンピュータービジョンです。彼の現在の研究プロジェクトは、医療 AI と医療画像処理に重点を置いています。

注目すべきは、この 2 人の研究者が以前にもニューラル ネットワークの剪定アルゴリズムを批判していたことです。

彼らは81のアルゴリズムを横方向に比較し、「これらのアルゴリズムが10年以内にタスクのパフォーマンスを大幅に向上させたという明確な証拠はない」ことを発見した。

この研究の筆頭著者であるデイビス・ブラロック氏も次のように考えている。

これらの改良は、研究者が主張する「中核的な革新」ではなく、いわゆる「微調整」であり、改良の中にはそもそも存在しないものもあるかもしれない。

2 人の著者は、AI モデルの効率性の向上に関しては実に厳格です。

プロジェクトアドレス:
https://github.com/dblalock/bolt

論文の宛先:
https://arxiv.org/abs/2106.10860

<<:  2025年以降の人工知能の未来(パート2)

>>:  フーダンの新しい服が再びネイチャーに登場しました!体に装着したまま携帯電話を充電でき、洗濯可能で折り曲げることもできます。

ブログ    
ブログ    
ブログ    

推薦する

未成年者の顔情報の処理には保護者の個別の同意が必要です

最高人民法院の楊万明副院長は、最高人民法院が十分な研究に基づいて顔情報に司法上の保護を与えるための「...

...

優れたオープンソースの音声認識/音声テキスト変換システム 5 つ

音声テキスト変換 (STT) システムは、その名前が示すとおり、話された言葉を後で使用するためにテキ...

機械学習があなたの好きな音楽を発見する方法: パーソナライズされた音楽推奨の背後にある科学

今週の月曜日も、他の月曜日と同様に、Spotify の 1 億人を超えるユーザー全員に新しいプレイリ...

スキルマップは、自動運転技術の開発経路が非常にシンプルであることを示しています

2015年8月から現在までに、人工知能、フロントエンド開発、モバイル開発、クラウドコンピューティング...

消防ドローンはあらゆる能力に優れていることから人気が高まっています!

火災による被害は明らかですが、火災の予防と制御は容易ではありません。たとえば、森林火災は、その範囲が...

施設管理の未来: 2024 年までの業界動向

2024 年に向けて、業界では建物の管理と保守の方法に影響を与えるいくつかの刺激的な変化が起こるでし...

CoCoPIE 主任科学者との対話: AI は審判になれるが、ショーを乗っ取ることはできない | T Frontline

「サッカーのフィールドで最もタブーなことは、誰もが明らかなファウルに気づいているのに審判が見て見ぬ...

ボーダーライン上の質問:テクノロジー企業はAIアルゴリズムを使って従業員の採用と解雇を行っている

アルゴリズムによる採用は珍しいことではありません。膨大な履歴書の審査を自動化するために AI アルゴ...

ディープラーニングが従来の方法ほど効果的ではない典型的な事例にはどのようなものがありますか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

ディープラーニングを使って背景を除去し、切り抜きを実現する方法の詳細な説明

上記のコースで、経験豊富な Web 開発者である Alon Burg と出会い、偶然にも同じような興...

アートデザインにおける人工知能

AdobeやCelsysなどのソフトウェア企業は近年、デジタルデザインソフトウェアに人工知能機能を追...

Google、ユーザーの文章力向上を支援するAI文法チェッカーをリリース

8月8日、IT Homeの友人はGrammarlyツールが提供する「文法チェック」サービスを使用した...

...

警告! 「リップリーディング」キーでデータを盗む、AIは本当に怖い

コンピューターに頼って悪者を即座に見つけることができれば素晴らしいのですが、問題は AI システムが...