Stability AI の今年最初のビッグモデルが登場しました! これは Stable Code 3B と呼ばれ、27 億個のパラメータを持ち、コード記述用に特別に設計されています。 Stable Code 3B は、100K トークンのコンテキスト長で、 18種類のプログラミング言語を理解して処理できます。 さらに、ハードウェア要件は高くなく、MacBook Air などの一般的なラップトップを使用してオフラインで実行できます。 パフォーマンスの面では、Stable Code 3B は CodeLLaMA 7B よりも 60% 小さくなりますが、パフォーマンスは同様です。 BigCode 評価では、Stable Code 3B は、複数のプログラミング言語を含む MultiPL-E データセット上で、同様のサイズのモデルと比較して SOTA パフォーマンスを達成しました。 安定版コード 3B がリリースされたばかりですが、一部のネットユーザーはすでにプラグインで使用していると報告しています。
安定コード 3B はどのようなものですか?これに先立ち、Stability AIは昨年8月に初期バージョンであるStable Code Alpha 3Bをリリースしました。Stable Code 3Bはその進化版です。しかし開発チームは、Stable Code 3B は Stable LM 3B ベースモデルをベースに構築され、いくつかの追加機能が追加された最初のメジャーバージョンであると述べています。 これには、中間充填 (FIM) や、コンテキストの長さを 16,000 トークンから 100,000 トークンに拡張するための RoPE (回転位置埋め込み) メソッドの使用などの新機能のサポートが含まれます。 Stable Code 3B の全体的なアーキテクチャは LLaMA に似ています。これは、Flash Attention 2 アルゴリズムを使用するデコーダーのみのモデルです。 以下の18のプログラミング言語がサポートされています。
以下はパフォーマンス比較の補足です。 安定した Code 3B のパフォーマンスは、その 2 倍以上のサイズの CodeLLama 7B とほぼ同等であり、Python および CPP 言語ではさらにわずかに優れています。 同様のサイズのモデルの中では、Stable Code 3B が際立っています。 しかし、不満もあるStable Code 3B は好評を博しているものの、多くのネットユーザーは「新しい点はあまりない」「それほど良くない」と考えています。 また、英語とプログラミング言語しかサポートされていないのも少し残念です。 これについてどう思いますか? 参考リンク: |
<<: 中国科学院は、プログラマーがバグを見つけるのを助けるために大きなモデルを使用し、102の論文を分析し、これらの解決策をまとめた。
一部の企業にとって、新型コロナウイルス感染症のパンデミックは壊滅的な打撃となっている。しかし、他の企...
[[426039]]かつて人々は、技術の進歩が労働者に大きな解放をもたらし、人類が牧歌的な生活を送れ...
[[255694]]プロフェッショナルソフトウェア開発における人工知能 (AI) の急速な発展により...
近年、テキストから画像への変換の分野は、特に AIGC (人工知能生成コンテンツ) の時代において大...
エネルギー効率などの複雑な建物の問題を、人間の介入なしに解決するにはどうすればよいでしょうか。建物の...
近年、人工知能、クラウドコンピューティング、ビッグデータ、モノのインターネット、産業用インターネット...
機械学習モデルが現実世界でますます使用され、導入されるようになると、AI の意思決定は人々の日常生活...
[51CTO.com クイック翻訳] 今日、人工知能はもはやSFの中の漠然とした概念ではなく、私たち...
2018年のダブルイレブンは、「富豪」に対する私の認識を新たにしました。その前に、アリババの張勇は...
[[402565]]インターネット業務に携わる陸鋒さんは、あるテクノロジー製品の機能やユーザーエクス...
[[422423]]お金が手に入ったとき、あなたはまだ当初の意図を貫くことができますか? OpenA...
健康診断のために病院に行くところを想像してください。診察室に入るとすぐに、看護師があなたの写真を撮り...
[[190464]]勾配降下法の理論部分では、導出プロセスが非常にわかりにくいと嘆いたことがあり、よ...