安定性AIの今年最初の大きなモデル：特別に書かれたコード、18のプログラミング言語をサポート、10万のコンテキストを持ち、Appleのラップトップでオフラインで実行可能

Stability AI の今年最初のビッグモデルが登場しました!

これは Stable Code 3B と呼ばれ、27 億個のパラメータを持ち、コード記述用に特別に設計されています。

Stable Code 3B は、100K トークンのコンテキスト長で、 18種類のプログラミング言語を理解して処理できます。

さらに、ハードウェア要件は高くなく、MacBook Air などの一般的なラップトップを使用してオフラインで実行できます。

パフォーマンスの面では、Stable Code 3B は CodeLLaMA 7B よりも 60% 小さくなりますが、パフォーマンスは同様です。

BigCode 評価では、Stable Code 3B は、複数のプログラミング言語を含む MultiPL-E データセット上で、同様のサイズのモデルと比較して SOTA パフォーマンスを達成しました。

安定版コード 3B がリリースされたばかりですが、一部のネットユーザーはすでにプラグインで使用していると報告しています。

効果はとても良いです！サイズが小さく、さまざまなハードウェアと互換性があり、非常に高速に動作します。

安定コード 3B はどのようなものですか?

これに先立ち、Stability AIは昨年8月に初期バージョンであるStable Code Alpha 3Bをリリースしました。Stable Code 3Bはその進化版です。しかし開発チームは、Stable Code 3B は Stable LM 3B ベースモデルをベースに構築され、いくつかの追加機能が追加された最初のメジャーバージョンであると述べています。

これには、中間充填 (FIM) や、コンテキストの長さを 16,000 トークンから 100,000 トークンに拡張するための RoPE (回転位置埋め込み) メソッドの使用などの新機能のサポートが含まれます。

Stable Code 3B の全体的なアーキテクチャは LLaMA に似ています。これは、Flash Attention 2 アルゴリズムを使用するデコーダーのみのモデルです。

以下の18のプログラミング言語がサポートされています。

C、CPP、Java、JavaScript、CSS、Go、HTML、Ruby、Rust、Markdown、Shell、Php、Sql、R、Typescript、Python、Jupyter-Clean、RestructuredText

以下はパフォーマンス比較の補足です。

安定した Code 3B のパフォーマンスは、その 2 倍以上のサイズの CodeLLama 7B とほぼ同等であり、Python および CPP 言語ではさらにわずかに優れています。

同様のサイズのモデルの中では、Stable Code 3B が際立っています。

しかし、不満もある

Stable Code 3B は好評を博しているものの、多くのネットユーザーは「新しい点はあまりない」「それほど良くない」と考えています。

また、英語とプログラミング言語しかサポートされていないのも少し残念です。

これについてどう思いますか？

参考リンク:
[1] https://huggingface.co/stabilityai/stable-code-3b
[2] https://twitter.com/StabilityAI/status/1747348018884493623

<<: 中国科学院は、プログラマーがバグを見つけるのを助けるために大きなモデルを使用し、102の論文を分析し、これらの解決策をまとめた。

>>: 医療製造におけるビジョンテクノロジー

安定性AIの今年最初の大きなモデル：特別に書かれたコード、18のプログラミング言語をサポート、10万のコンテキストを持ち、Appleのラップトップでオフラインで実行可能

安定コード 3B はどのようなものですか?

しかし、不満もある

ジェネレーティブ AI がデジタル変革の優先事項に与える影響

アリババに採用された中国の高レベル科学者がAIがもたらす想像力の空間について語る

COVID-19パンデミックは顔認識技術の導入を促進している

5分で強力で使いやすいディープラーニング環境を構築

中国科学院：巨大モデルのIQは称賛されると桁外れに上昇！ ChatGPT の感情知能は 98 ポイントで、数秒で人間の感情知能を上回ります。ヒントンの予測は当たったのでしょうか?

チャット記録をアップロードして自分自身を「複製」する。このスタートアップは「ブラックミラー」の第 1 話を現実のものにしました

ドローンは都市の発展を助け、6つの側面でインテリジェントな変化をもたらす

運輸・物流業界におけるAIと自動化のユースケース

推薦する

将来の不動産価格決定はAIが最終決定する

アルゴリズムによる管理下にある労働者：労働の退化と集団不安

人工知能は私たちの仕事を奪うわけではないが、雇用方法を変えている

画像内のテキストを心配する必要はありません。TextDiffuserは高品質のテキストレンダリングを提供します。

機械学習による建物のエネルギー効率の向上

ジャック・マー：機械が人間に取って代わることは決してできない！それは何に代わるのでしょうか?

Googleの華博士がICCV2021で新モデルを発表、卵を泡立てるだけでパンケーキを作りたいかどうかがわかる

反論: AIに急いで取り組むべきではない5つの理由

人工知能認識により、物流会社はダブルイレブンの注文に簡単に対応できます。

中国人はアルゴリズムと戦い始めている：ログインなし、いいねなし、フォローなし、コメントなし

OpenAI が 10 億ドルで Microsoft に売却された後、汎用人工知能にはまだ希望があるのでしょうか?

AIが独自に病気を診断できる場合、人間の医師は責任を回避できるのでしょうか？

線形回帰の勾配降下アルゴリズムのオクターブシミュレーション