エッジAI: ディープラーニングをより効率的にする方法

エッジAI: ディープラーニングをより効率的にする方法

人工知能 (AI) は今日の産業情勢を変えています。 エンタープライズ ソフトウェアから機械の自動化まで、あらゆるものが、私たちの世界を理解するための多層ニューラル ネットワーク (十分なデータとトレーニング) の能力の恩恵を受けています。 しかし、ディープラーニング モデルの規模が拡大し続け、より複雑な自然言語処理 (NLP) やその他の AI アプリケーションへの扉が開かれるにつれて、必要なコンピューティングの量も増加しています。 これはエッジ AI にとって問題です。

エッジAIのトレンド

スマートフォンや車載車両などのポータブル コンピューティング ハードウェアにディープラーニング アルゴリズムを導入すると、ユーザーは強力な画像認識機能にアクセスできるようになります。これは、数ある使用例の 1 つにすぎません。 エッジ AI ハードウェア上でモデルをローカルに実行すると、接続の中断に対する耐性が得られます。

エネルギーに関する考慮事項もあります。 数十億のパラメータを持つモデルをトレーニングするためのエネルギーコストと、そのプロセスで消費される大量の冷却水を考えると、ユーザーはクラウドで大規模な AI アルゴリズムを実行することによる環境への影響に疑問を持ち始めています。 しかし、開発者は、結果の精度にほとんど影響を与えずに、ディープラーニング推論の計算負荷を軽減するモデルのプルーニングの専門家になっていることが判明しました。

これらの効率化対策は、エッジでの AI 実装にとって朗報です。 さまざまなアプローチがどのように機能するかを理解するには、まずディープラーニングの概要を描き、多層ニューラル ネットワークが入力を意味のある出力に変換する仕組みを検討すると役立ちます。

抽象的なレベルでは、ディープ ニューラル ネットワークは汎用的な関数近似器として考えることができます。 十分なパラメータがあれば、すべてを数学関数で表現できます。 3D で描画すると貝殻のように見える数式や、木の枝に似たフラクタルを見たことがあるかもしれません。 大規模な人工ニューロンのグループは、画像を描写したり、文章中の欠落した単語を見つけたりできることが判明しました。

これらの AI アルゴリズムをトレーニングするには、人工ニューロンのパターンが画像のエッジ特徴などの特定の入力に敏感になるように、何百万ものモデルの重みを微調整する必要があります。 対応する人工ニューロンを「発火」させるために必要な活性化の強度を決定するために、ネットワーク内の各ノードにバイアスを設定する必要もあります。

ノブだらけのアナログ音楽シンセサイザーを見たことがあるなら、これは良い例えですが、ノブの数は 100 万倍以上にもなります。 入力はカメラからのフィードであり、すべての設定が完了すると、画像内に犬が映るたびにカメラのライトが点灯します。

ダイヤルの数字を見ると、いくつかのパラメータが他のパラメータよりも重要であることがわかる場合があります。 ここで、モデル プルーニングの概念が生まれます。これは、アルゴリズムをエッジ AI ハードウェアに押し込む方法です。

今日、開発者はさまざまな方法を使用して、パフォーマンスを損なうことなくエッジ AI ニューラル ネットワークをより高速かつ小型に実行できるようにしています。 1 つのアプローチは、非常に小さなモデルの重みをゼロにすることです。これにより、アルゴリズムの動作にほとんど影響を与えない人工ニューロンを正確に特定できます。

もう 1 つの方法は、剪定されたモデルを数回の反復で再トレーニングすることです。これにより、失われた精度を回復するために他のパラメータを微調整できるようになります。 一部のプルーニングされた画像認識アルゴリズムは、生のニューラル ネットワークよりも効果的に機能し、エッジ AI にとって素晴らしい結果をもたらします。

残念ながら、大規模言語モデル (LLM) は、再トレーニングの手順が簡単ではないため、最適化がより困難になる可能性があります。 しかし、Wanda (重みとアクティベーションによる剪定) と呼ばれる新しい方法が LLM の LLaMA ファミリーで評価され、アクティベーション パスを考慮すると、パフォーマンスを大幅に低下させることなく構造の 50% を剪定できることが示されています。 さらに重要なのは、重みを更新するためにトレーニングを再実行する必要がないことです。

また、重みがどのように表現されるかについても考えると役立ちます。たとえば、単精度浮動小数点形式 (FP32) ではなく 8 ビット整数として値を保存すると、メモリを大幅に節約できます。 従来、モデルの重みは 0 から 1 の間でスケーリングされていましたが、これらの値はメモリ効率の高い整数から復元して処理することもできます。

エッジ AI アプリケーションのアルゴリズムをより効率的にするためのもう 1 つの戦略は、いわゆる教師モデルと生徒モデルを展開することです。このモデルでは、生徒が教師によって提供されるより豊富な情報から学習できます。 具体的には、教師モデルは、最も可能性の高い結果の確率分布をトレーニング入力として生徒モデルに提供できます。

このアプローチは、BERT の改良版である、より小型、高速、安価、軽量の DistilBERT の構築に効果的に使用されました。 Hugging Face の研究者は、教師と生徒のモデル (知識蒸留とも呼ばれる) を使用して、言語理解の 97% を維持しながら BERT モデルのサイズを 40% 削減し、速度を 60% 向上できることを示しました。

これがなぜ重要なのかを理解するには、BERT が現在利用可能な最も有用な NLP モデルの 1 つであることに注目する価値があります。 BERT はテキスト エンコーディングに使用して、他のデータから類似の文章を取得できます。 大量のテキスト情報を要約し、質問に対する回答を提供できます。

エッジ AI を念頭に置いた軽量 NLP モデルは、データをローカルで処理してプライバシーを保護し、顧客がクラウドに送信したくない機密情報を保護できます。 たとえば、企業は DistilBERT を使用して独自のセマンティック検索エンジンを構築し、Google にデータを送信せずにビジネス データをナビゲートすることができます。

人工知能の成功事例

クラウドにおける AI の成功事例は、さまざまなユースケースに影響を与えています。 また、開発者がアルゴリズムのパフォーマンスをより小さなフットプリントに詰め込むことに熟練するにつれて、これらの利点がエッジ AI アプリケーションにも応用されることが期待されます。

さらに、ユーザーは機械学習モデルを最適化するために、ますます多くのツールを利用できます。 Google の TensorFlow モデル最適化ツールキットは、処理、メモリ、電力消費、ネットワーク使用量、モデル ストレージ スペースに制約があるエッジ デバイスへのモデルの展開をサポートします。

組み込みシステムに効率的なディープラーニングを提供できるモデル最適化 SDK などの他のオプションもあります。 ベンダーには、事業拡大のため最近4,500万スウェーデン・クローナ(410万ドル)を調達したスウェーデンのディープテック企業Embedlも含まれる。

「エンベドルのソリューションは、自動車分野での自動運転システム(AD)や先進運転支援システム(ADAS)の開発において、大幅なパフォーマンス向上を実現します」と同社はウェブサイトに記している。 「これにより、それほど強力でないハードウェアを搭載した消費者向け製品に AI を組み込むことも可能になります。」

同社によれば、顧客はSDKを使用して、バッテリー駆動のデバイスで実行できるディープラーニングアルゴリズムを作成でき、エッジAIの新たなトレンドとなるという。

<<:  後から登場したが、最初に登場したテンセントのHunyuanモデルの技術的なハイライトは何ですか?

>>:  建築設計におけるスマートビルディングと IoT の統合

ブログ    
ブログ    

推薦する

機械読解:人工知能技術の重要な分野の一つ

機械読解(MRC)は、自然言語処理の分野における最近の研究のホットスポットの 1 つであり、人間の言...

国際数学オリンピック連続優勝、基礎学問の科学技術戦略価値の分析

[[344622]] 第61回国際数学オリンピック(IMO)2020の結果が先日発表されました。中国...

慎重なソート - よく使われる 10 のディープラーニング アルゴリズム

過去 10 年間で、機械学習への関心は爆発的に高まりました。機械学習は、コンピューター プログラム、...

あなたの頭上に「ロボット」がやって来ます!起業家の知恵:リアルタイムで位置を特定し、自動的に警報を鳴らすスマートヘルメットの開発

[[317160]]建設作業中には、火災、電気、機械など、多くの潜在的な安全上の危険が存在します。安...

ディープラーニングの19の格闘技を見てください。絶滅危惧動物の保護にも役立ちます

絶滅危惧動物を研究する上で最大の課題の一つは、その数を正確に推定することであり、各個体を追跡して詳細...

...

1時間から3.5分まで、Metaの新しいアルゴリズムは携帯電話で3D顔データを収集できる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIは私たちが何を見て、何を考えるかを静かにコントロールしている

私たちの日常生活では、携帯電話のさまざまなアプリにますます依存するようになっています。外食時にレスト...

ニューラルネットワークの詳細な説明、順方向伝播と逆方向伝播

主にロジスティック回帰について説明します。ロジスティック回帰には多くの基本概念が含まれており、ニュー...

5 分で機械学習モデルのハイパーパラメータを最適化するマスターマニュアル

[[396168]]機械学習アルゴリズムには、特定のデータセットに合わせて調整できるハイパーパラメー...

2024 年のエネルギー管理における AI のトレンドトップ 10

アクセンチュアのレポートによると、エネルギー分野で AI を活用することで、2035 年までにエネル...

180 の大学が人工知能専攻の追加を承認されました。これらの大学への出願をお勧めしますか?

[[317457]]教育部が発表した最新の学部専攻新登録リストでは、理工系や総合大学のほか、語学や...

AT&T Business: ゼロトラストは AI アプリケーションのリスクを軽減する万能薬

人工知能(AI)技術は、多くの業界の業務運営モデルを変えつつあります。AIは、多くの人材を面倒な事務...

次世代オーディオアシスタント: AI がオーディオ体験をどう形作るか

人工知能(AI)はここ数か月、ビジネス環境における流行語となっています。効率性の向上、コストの削減、...