「トランスフォーマー チャレンジャー」マンバはMacBookでも動く! GitHub は半日で 500 以上のスターを獲得しました

「トランスフォーマー チャレンジャー」マンバはMacBookでも動く! GitHub は半日で 500 以上のスターを獲得しました

「トランスフォーマーの挑戦者」MambaがMacBookで実行できるようになりました!

誰かが GitHub で、Mamba を最も簡単な方法で実行できるというメモを共有しました。

この共有には取扱説明書を含めてたった3つのファイルしかありませんが、公開されてから1日も経たないうちに500以上のスターを獲得しています。

写真

Mamba は、言語タスクやその 2 倍のサイズの Transformer と同等のパフォーマンスを発揮する新しい大規模モデル アーキテクチャです。

ただし、公式バージョンではモデル ファイルのみが提供されており、展開して使用するには一定の専門知識が必要であり、実行するには Linux+N カードが必要です。

写真

このノートにより、Mamba を実行する手順が大幅に簡素化され、N カードが不要になったため、M シリーズの MacBook でも実行できるようになりました。

これを見た関連職業に就いているネットユーザーたちは、この簡素化されたモデルは本当に素晴らしいと述べ、自分たちの仕事もこの方向に進むことを望んでいると語った。

写真

オリジナルの『マンバ』の著者であるトリ・ダオ氏とアルバート・グ氏もこのメモを転送し、そのシンプルさと読みやすさを称賛した。

写真

では、このメモはどのように使用すればよいのでしょうか?

2つのファイルを実行できる

まず、Jupyter、VSCode、オンライン Google Colab など、PyTorch ノートブックを実行できるツールを開きます。

次に作者のメモとPythonスクリプトをダウンロードします。Colabを使用している場合は、GitHubのインポート機能も使用できます。

ローカルで実行する場合は、2 つのファイルを同じディレクトリに配置する必要があります。Colab を使用する場合は、接続が成功した後に model.py をアップロードする必要があります。

アップロードしないと、「モデルが見つかりません」というエラーメッセージが表示されます。

次に、必要な依存関係環境をインストールします。Colab では、einops を手動でインストールする必要があります。他のツールでは、エラー情報に基づいて不足している依存関係を判断できます。

!pip install インストールする依存関係の名前

写真

依存関係の問題を解決したら、最初のノートのグループにある実行ボタンをクリックできます。ここで、モデルのスケールを選択できます。デフォルトは 370M です。

写真

次は初期化です。実行ボタンをクリックするだけです。

出力トークンの数もここで調整できます。デフォルトは 50 です。

写真

次に、注記にいくつかの例を示します。プロンプトの内容を一重引用符で囲んで変更することもできます (改行は \n で表されます)。その後、[実行] をクリックします。

ただし、ここでのプロンプトは、ChatGPT などのボット アプリケーションを通常使用する方法とは異なることに注意してください。

写真

ここで、Hugging Face の Llama 2 のシステム プロンプトの単語を借用します。

以下は、さまざまな人々と AI アシスタントとの一連の対話です。AI は、親切で、礼儀正しく、正直で、洗練されていて、感情に敏感で、謙虚でありながら知識豊富であろうとします。アシスタントは、ほとんど何でも喜んで手伝ってくれ、必要なことを正確に理解するために最善を尽くします。また、誤った情報や誤解を招く情報を提供することを避け、正しい答えがわからない場合は警告します。とはいえ、アシスタントは実用的で、本当に最善を尽くしており、用心深さが役に立つことの妨げにならないようにしています。ユーザー: 質問アシスタント:

写真

パフォーマンスの面では、デフォルトのスケールと出力長 (370M、50 トークン) では、Once Upon a time の入力に Colab の純粋な CPU バージョンでは約 1 分、TPU では約 30 秒かかり、メモリ消費量は 3 ~ 4 GB になります。

写真

M1 チップを搭載した Mac では、同じ設定で同じコンテンツを処理するのに約 1 分半かかります。

写真

しかし、著者は、読みやすさを考慮して、オリジナルの Mamba の一部の加速命令が削除されたことも説明しました。

写真

参考リンク: https://news.ycombinator.com/item?id=38708730

<<: 

>>: 

ブログ    
ブログ    
ブログ    

推薦する

機械学習について知っておくべき6つの革命的な教訓

私たちは、ロボット工学、スマート家電、スマート小売店、自動運転車技術などによって推進される新しい時代...

7年間の変革:WOT2018がテクノロジーの背後にある真実を明らかにする

2018 年のインターネット業界が新たな変化の時期を迎えていることは否定できません。新たなアップグレ...

百度AIシティが上海と契約を締結、インテリジェントイノベーションで上海に新たな伝説を刻む

11月27日、百度は上海市政府と戦略的協力枠組み協定を締結した。上海市党委員会書記の李強氏と市党委員...

あなたのお子さんは「顔スキャン」されましたか?顔認識技術がキャンパスに導入され物議を醸す

現在、顔認識の応用はますます深く広範囲になり、それが引き起こす論争もますます激しくなっています。まず...

インペリアル・カレッジ:専門医の80%が懸念する心臓リズムデバイスインプラント手術問題をAIで解決する方法

インペリアル・カレッジ・ロンドンの研究者らは、ペースメーカーや除細動器のメーカーとモデルを識別するた...

ロボットチャットGPTが登場: ビッグモデルが現実世界に登場、DeepMindの画期的な進歩

インターネット上の言語と画像を習得した後、大きなモデルが最終的に現実世界に入り、「具現化された知能」...

第2世代GANネットワークの台頭? DALL·E Miniのグラフィックが恐ろしく、外国人も大興奮!

現在、GoogleやOpenAIなどの大手企業が開発したテキストから画像へのモデルは、興味深いニュー...

ヴェノムのように変形・修復可能なロボットが登場、1.5mmの亀裂も楽々通過

映画「ヴェノム」を見たことがある友人なら、「シンビオート」が液体の形で現れることを知っているでしょう...

タオバオライブストリーミングにおける機械学習に基づく帯域幅推定の探求と実践

背景メディア伝送における一般的な帯域幅推定アルゴリズムには、GCC/BBR/PCC/QUBIC など...

人工知能技術に注目し導入すべき3つの理由

AI の導入が拡大しているにもかかわらず、多くの IT リーダーは AI のリスクと機会を取り巻く不...

機械学習の理解と考察

[[199326]]近年、人工知能の力強い台頭、特に昨年のAlphaGoと韓国のチェスプレイヤー、イ...

1行のコードでデバッグと印刷を排除し、アルゴリズムの学習を支援

[[442725]]この記事はWeChatの公開アカウント「Python Technology」から...

Python での遺伝的アルゴリズムによるガベージ コレクション戦略の最適化

遺伝的アルゴリズムは、進化のプロセスに性質が似ている最適化手法です。これは乱暴な例えかもしれませんが...

飲食店がセルフオーダー機や配達ロボットを導入すれば「無人飲食店」になるのでしょうか?

ケータリング業界における人件費は、事業者を悩ませる大きな問題です。レストランなどのケータリングのシナ...

ハーバード史上最短の在職期間! 53歳の女性校長、博士論文の盗作疑惑で辞職

ハーバード大学の第30代学長が正式に辞任を発表しました! 53歳のクローディン・ゲイ氏は昨年7月に就...