安定性AIの今年最初の大きなモデル:特別に書かれたコード、18のプログラミング言語をサポート、10万のコンテキストを持ち、Appleのラップトップでオフラインで実行可能

安定性AIの今年最初の大きなモデル:特別に書かれたコード、18のプログラミング言語をサポート、10万のコンテキストを持ち、Appleのラップトップでオフラインで実行可能

Stability AI の今年最初のビッグモデルが登場しました!

これは Stable Code 3B と呼ばれ、27 億個のパラメータを持ち、コード記述用に特別に設計されています。

Stable Code 3B は、100K トークンのコンテキスト長で、 18種類のプログラミング言語を理解して処理できます。

さらに、ハードウェア要件は高くなく、MacBook Air などの一般的なラップトップを使用してオフラインで実行できます

パフォーマンスの面では、Stable Code 3B は CodeLLaMA 7B よりも 60% 小さくなりますが、パフォーマンスは同様です。

BigCode 評価では、Stable Code 3B は、複数のプログラミング言語を含む MultiPL-E データセット上で、同様のサイズのモデルと比較して SOTA パフォーマンスを達成しました。

安定版コード 3B がリリースされたばかりですが、一部のネットユーザーはすでにプラグインで使用していると報告しています。

効果はとても良いです!サイズが小さく、さまざまなハードウェアと互換性があり、非常に高速に動作します。

安定コード 3B はどのようなものですか?

これに先立ち、Stability AIは昨年8月に初期バージョンであるStable Code Alpha 3Bをリリースしました。Stable Code 3Bはその進化版です。しかし開発チームは、Stable Code 3B は Stable LM 3B ベースモデルをベースに構築され、いくつかの追加機能が追加された最初のメジャーバージョンであると述べています。

これには、中間充填 (FIM) や、コンテキストの長さを 16,000 トークンから 100,000 トークンに拡張するための RoPE (回転位置埋め込み) メソッドの使用などの新機能のサポートが含まれます。

Stable Code 3B の全体的なアーキテクチャは LLaMA に似ています。これは、Flash Attention 2 アルゴリズムを使用するデコーダーのみのモデルです。

以下の18のプログラミング言語がサポートされています。

C、CPP、Java、JavaScript、CSS、Go、HTML、Ruby、Rust、Markdown、Shell、Php、Sql、R、Typescript、Python、Jupyter-Clean、RestructuredText

以下はパフォーマンス比較の補足です。

安定した Code 3B のパフォーマンスは、その 2 倍以上のサイズの CodeLLama 7B とほぼ同等であり、Python および CPP 言語ではさらにわずかに優れています。


同様のサイズのモデルの中では、Stable Code 3B が際立っています。

しかし、不満もある

Stable Code 3B は好評を博しているものの、多くのネットユーザーは「新しい点はあまりない」「それほど良くない」と考えています。

また、英語とプログラミング言語しかサポートされていないのも少し残念です。


これについてどう思いますか?

参考リンク:
[1] https://huggingface.co/stabilityai/stable-code-3b

[2] https://twitter.com/StabilityAI/status/1747348018884493623

<<:  中国科学院は、プログラマーがバグを見つけるのを助けるために大きなモデルを使用し、102の論文を分析し、これらの解決策をまとめた。

>>:  医療製造におけるビジョンテクノロジー

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

AI革命はネットゼロデータセンターに終止符を打つのでしょうか?

これらの施設は重要であるにもかかわらず、あまり理解されていません。しかし、最近ではデータセンターに注...

...

マスク氏「高度なAIの開発は非常にリスクが高い。OpenAIはアルトマン氏を解雇した理由を明らかにすべき」

11月20日、テスラのCEOイーロン・マスク氏は、高度な人工知能(AI)技術の開発には大きな潜在的...

人工知能とソフトウェアアーキテクチャ

[[192443]] AlphaGoの登場により、2016年は人工知能元年とも言えるでしょう。蘇州で...

GPT-4 はチューリングテストに合格しませんでした。 60年前、古いAIはChatGPTに勝利しましたが、人間の勝率はわずか63%でした。

長い間、「チューリングテスト」は、コンピュータが「知性」を持っているかどうかを判断するための中心的な...

2億IoTエコシステム、人民教育新聞とAI教育で協力、天猫精霊プラットフォームレイアウトが収穫期に入る

9月25日、アリババ人工知能研究所は雲啓カンファレンスで、Tmall Genieは現在660以上のI...

IBMは、人間の音声認識の実際の単語エラー率は5.1%であると主張している。

昨年 10 月、マイクロソフトの AI および研究部門の研究者およびエンジニアのチームは、自社の音声...

Capital One は NLP を使用して SMS 経由で顧客と潜在的な詐欺行為について話し合う

[[412098]] [51CTO.com クイック翻訳]キャピタル・ワンのモバイル、ウェブ、会話型...

...

シングルを保存: このオブジェクトジェネレーターは、将来のオブジェクトがどのように見えるかを確認するのに役立ちます

将来の妻や夫がどんな人か分からないですか?さあ、まずはAIを使って予測してみましょう。 [[3123...

すぐに理解できます: 電流制限におけるリーキーバケットとトークンバケットアルゴリズム

[[346652]]この記事は、陳建宇氏が執筆したWeChatパブリックアカウント「私の脳は揚げ魚で...

...

...

大規模言語モデルにおけるプライバシーの考慮

[[430922]]文中の次の単語を予測するようにトレーニングされた機械学習ベースの言語モデルは、ま...