Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

Appleが自社チップ用のオープンソースフレームワークMLXを開発、Llama 7Bを実装しM2 Ultraで動作

2020年11月、Appleは速度と強力な機能の点で驚異的なM1チップを発売しました。 2022年にAppleはM2を発売し、今年10月にはM3チップが正式にデビューしました。

Apple はチップをリリースする際に、チップ上で AI モデルをトレーニングおよび展開する機能にも大きな重点を置いています。

Apple の ML Compute を使用して、Mac 上で TensorFlow モデルをトレーニングできます。 PyTorch は、Apple Metal Performance Shaders (MPS) をバックエンドとして使用し、Mac の M1 バージョンで GPU アクセラレーションされた PyTorch 機械学習モデル トレーニングをサポートします。これにより、Mac ユーザーはニューラル ネットワークをローカルでトレーニングできるようになります。

現在、Apple は、Apple チップ上での機械学習専用のオープンソース配列フレームワークである MLX のリリースを発表しました。

MLX は、機械学習研究者が AI モデルを効率的にトレーニングおよび展開できるように特別に設計されています。フレームワーク自体の設計も概念的にはシンプルです。研究者は MLX を簡単に拡張および改善して、新しいアイデアを迅速に探索およびテストできます。 MLX のデザインは、NumPy、PyTorch、Jax、ArrayFire などのフレームワークからインスピレーションを得ています。

プロジェクトアドレス: https://github.com/ml-explore/mlx

Apple の機械学習研究 (MLR) チームの研究者であり、MLX プロジェクトの貢献者の 1 人である Awni Hannun 氏は、MLX フレームワークを使用して Llama 7B を実装し、それを M2 Ultra で実行するビデオを公開しました。

MLX はすぐに機械学習研究者の注目を集めました。 TVM、MXNET、XGBoost の作者であり、カーネギーメロン大学の助教授、OctoML の CTO である Chen Tianqi 氏は、「Apple チップには新しいディープラーニング フレームワークが搭載されています」とリツイートしました。

一部のネットユーザーはMLXについてコメントし、Appleが再び「車輪の再発明」をしたと述べた。

画像出典: https://twitter.com/ofervic/status/1732305883814596953

MLX の機能、例

このプロジェクトでは、MLX には次の主な機能があることがわかります。

使い慣れた API 。 MLX には、NumPy に非常によく似た Python API と、フル機能の C++ API (Python API に非常によく似ています) があります。 MLX には、API が PyTorch と非常によく似ている、より複雑なモデルの構築を簡素化できる高レベル パッケージ (mlx.nn や mlx.optimizers など) もあります。

構成可能な関数変換。 MLX は、自動微分、自動ベクトル化、計算グラフ最適化を備えた構成可能な関数変換を特徴としています。

遅延評価。 MLX での計算は遅延され、配列は必要な場合にのみインスタンス化されます。

動的グラフ構築。 MLX の計算グラフ構築は動的であり、関数パラメータの形状を変更してもコンパイル速度が低下することはなく、デバッグもシンプルで使いやすいです。

マルチデバイス。操作は、CPU や GPU など、サポートされている任意のデバイスで実行できます。

統合メモリ。 MLX と他のフレームワークの大きな違いは、配列がメモリを共有する統合メモリです。 MLX での操作は、モバイル データを必要とせずに、サポートされている任意のデバイス タイプで実行できます。

さらに、このプロジェクトでは、MNIST の例など、MLX フレームワークを使用するさまざまな例が提供されており、MLX の使用方法を学ぶのに適しています。

画像ソース: https://github.com/ml-explore/mlx-examples/tree/main/mnist

MLX には、次のような便利な例が他にもたくさんあります。

  • Transformer言語モデルのトレーニング。
  • LLaMA 大規模テキスト生成と LoRA 微調整。
  • 安定した拡散により画像が生成されます。
  • OpenAI の Whisper 音声認識。

詳細なドキュメントについては、https://ml-explore.github.io/mlx/build/html/install.html# を参照してください。

<<:  人間を超えた最初の専門家! OpenAIが混乱に陥る中、Googleのマルチモーダル大規模モデルGeminiがそれを打ち負かす

>>:  Googleがこれまでで最も強力なAIモデル「Gemini」を発表

ブログ    
ブログ    

推薦する

人工知能の急速な発展により、小売業界は第5の変革期を迎えている。

[[252330]]人工知能の急速な発展は、新しい小売業者に力を与え、小売業界の「人、商品、場所」...

機械学習モデルを構築するときに避けるべき 6 つの間違い

近年、機械学習は学術研究や実用化の分野でますます注目を集めています。しかし、機械学習モデルの構築は簡...

TensorFlow が素晴らしい機械学習データセット 30 選

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

DeepMindのAIが核融合炉の制御を学習、Nature誌に発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

GPT-3 がマーベル ユニバースに登場! 2Dの男がスパイダーマンの続編を作るためにそれを使用しました

GPT-3 は論理的な手順に従ってコーパステキストを洗練して要約できるため、詩やラップの歌詞を書くの...

Excelが変わりました! MicrosoftはPythonを搭載しているので、機械学習を直接行うことができます。

素晴らしいニュースです! Microsoft が Excel に Python を導入しました。 E...

米国でレベル4自動運転システムの一部がリコールされた。Pony.aiはどんなミスを犯したのか?

自動運転車が交通事故に巻き込まれるのは今回が初めてではない。しかし、今回のPony.aiによるL4...

法律、AIが革命を起こすもう一つの業界

[[270591]]弁護士は、法律知識、鋭敏な時間管理、説得力、雄弁さなど、多くのスキルを身につけて...

...

研究者はディープラーニングモデルを使って交通事故を予測する

[51CTO.com クイック翻訳]現在の世界は、コンクリートやアスファルトでできた巨大な迷路のよう...

5GとAIの強力な組み合わせは、どのような新たな機会をもたらすのでしょうか?

[[261281]]新興技術への投資家として、私は既存の市場を改善したり、新しい市場を創出したりで...

...

2D画像が3Dになる、マイクロソフトの新しいAIフレームワークはゲーム業界に恩恵をもたらすかもしれない

Leifeng.com 注: 上の画像は、Microsoft モデルによって生成された 3D ソファ...