Nvidia、Hugging Face、ServiceNow がコード生成用の新しい StarCoder2 LLM をリリース

Nvidia、Hugging Face、ServiceNow がコード生成用の新しい StarCoder2 LLM をリリース

現在 3 つの異なるサイズで提供されているこれらのモデルは、リソースの少ない言語を含む 600 以上のプログラミング言語でトレーニングされており、企業が開発ワークフローでさまざまなコード関連タスクを高速化するのに役立ちます。これらのモデルは、大規模コード言語モデルの責任ある開発と使用を保証するために ServiceNow と Huging Face が共同で取り組んでいるオープンな BigCode プロジェクトの下で開発されており、Open Responsible AI License の下で無料で利用できます。

StarCoder2 は、オープンな科学的コラボレーションと責任ある AI 実践を倫理的なデータ サプライ チェーンと組み合わせることで得られる威力を実証しています。 ServiceNow の StarCoder2 開発チームのリーダーであり、BigCode の共同リーダーでもあるハーム・デ・フリース氏は声明で、最先端のオープン アクセス モデルは、以前の GenAI 機能を改善して開発者の生産性を高め、コード生成 AI の利点を開発者に平等に提供することで、あらゆる規模の企業がビジネスの可能性を最大限に発揮しやすくなると述べています。

StarCoder2: 3つの異なるニーズに対応する3つのモデル

BigCode の StarCoder LLM の最初のリリースでは、パラメータが 150 億個しかなく、約 80 種類のプログラミング言語でトレーニングされていましたが、最新世代ではそれを超え、30 億、70 億、150 億の 3 つの異なるモデル サイズでリリースされ、619 種類のプログラミング言語でトレーニングされています。 BigCodeによると、「Stack」と呼ばれる新しいモデルは、前回使用されたときよりも7倍以上大きいデータでトレーニングされたという。

さらに、BigCode コミュニティは、最新世代の新しいトレーニング手法を使用して、モデルが COBOL、数学、手続き型ソースコードディスカッションなどのリソースの少ないプログラミング言語を理解し、生成できるようにしました。

最小の 30 億パラメータ モデルは ServiceNow の Fast LLM フレームワークを使用してトレーニングされ、7B モデルは Huging Face の Nantron フレームワークを使用して開発されました。どちらも、少ないコンピューティングで高性能なテキストからコードへの生成とテキストからワークフローへの生成を提供するように設計されています。

一方、最大の 150 億パラメータ モデルは、エンドツーエンドの NVIDIA Nemo クラウド ネイティブ フレームワークと NVIDIA TensorRT-LLM ソフトウェアを使用してトレーニングおよび最適化されました。

これらのモデルがさまざまなエンコード シナリオでどの程度の性能を発揮するかはまだ不明ですが、両社は、最小の 3B モデルがオリジナルの 15B StarCoder LLM と同等の性能を発揮すると述べています。

エンタープライズ チームは、ニーズに応じてこれらのモデルのいずれかを使用し、さまざまなユース ケースのエンタープライズ データに基づいてさらに微調整することができます。ユース ケースには、アプリケーションのソース コード生成、ワークフロー生成、テキスト要約から、コード補完、高度なコード要約、コード スニペットの取得まで、あらゆる特殊なタスクが含まれます。

両社は、これらのモデルはより広範かつ深くトレーニングされており、リポジトリのコンテキストを提供することで、正確でコンテキストを意識した予測が可能になると強調した。最終的には、これらすべてにより開発が高速化され、エンジニアや開発者の時間が解放され、より重要なタスクに集中できるようになります。

「すべてのソフトウェアエコシステムには独自のプログラミング言語があるため、CodeLLM はあらゆる業界で効率性と革新性において飛躍的な進歩をもたらすことができます」と、Nvidia の応用研究担当副社長、ジョナサン・コーエン氏はプレス声明で述べています。

「NVIDIA と ServiceNow および Huging Face の連携により、安全で責任ある開発モデルが導入され、責任ある GenAI へのより広範なアクセスがサポートされ、世界中の社会に利益をもたらすことを期待しています」と同氏は付け加えた。

StarCoder2 の使用を開始するにはどうすればよいですか?

前述のとおり、StarCoder2 コレクションのすべてのモデルは Open Rail-M ライセンスに基づいて提供されており、ロイヤリティフリーのアクセスと使用が可能です。サポートコードは、BigCode プロジェクトの GitHub リポジトリにあります。別の選択肢として、チームはフェイスハガーの 3 つのモデルすべてをダウンロードして使用することもできます。

とはいえ、NVIDIA がトレーニングした 150 億のモデルは NVIDIA AI Foundation でも利用可能になり、開発者はブラウザーから直接、または API エンドポイントを通じてそれらのモデルを試すことができます。

StarCoder は AI 駆動型コード生成の分野に初めて参入した企業ではありませんが、プロジェクトの最新世代によってもたらされた幅広いオプションにより、企業はアプリケーション開発で LLMS を活用しながら、コンピューティングコストを節約できるようになります。

この分野の他の注目企業としては、GitHub フェデレーション パイロット サービスを支える Codex を提供する OpenAI や、CodeWhisper ツールを提供する Amazon などがある。また、Hugging Face にいくつかの小規模な AI コーディング モデルを持つ Replit や、​​最近シリーズ B の資金調達で 5 億ドルの評価額で 6,500 万ドルを調達した Codenium との激しい競争もある。

<<:  AIとERPが出会うとどんな「化学反応」が起こるのでしょうか?

>>:  施設管理の未来: 2024 年までの業界動向

ブログ    

推薦する

機械学習を使って純粋数学を新たな方法で探求する

1 世紀以上前、インドの伝説的な数学者シュリニヴァーサ・ラマヌジャンは、その比類のない数学的才能で数...

...

クラウドに人工知能を導入する際の 10 の考慮事項

クラウド コンピューティングは、あらゆる規模の企業がインターネット経由で多様なオンデマンドの仮想 I...

機械学習研究の10年

[[271167]] 10年前のMSRAの夏、私が初めて機械学習の研究に挑戦したとき、科学研究におけ...

AIは胸部X線写真からCOVID-19を検出できる

先週、ノースウェスタン大学の研究者らは、胸部X線写真からCOVID-19感染の兆候を検出できる新たな...

製造バリューチェーンにおいて RPA に真のチャンスはあるのでしょうか?

製造業における自動化の推進力は非常に単純です。自動化は人間の作業をシミュレートするため、人間は製造バ...

検出器がミスを犯し、英語を母国語としない人が書いた英語の記事の半分以上がAIによって書かれたと判定された。

7月13日、スタンフォード大学の研究者らは、英語を母国語としない人が英語の語彙力を十分持っていない...

...

人工知能によって仕事が置き換えられた後、一般の人々は何をすべきでしょうか?

The Paperによると、世界経済フォーラムの報告書では、2025年までに8000万の仕事が機械...

人工知能は将来のデジタルワークプレイスをどのように変えるのでしょうか?

[[347778]]デジタルワークプレイス コミュニケーション ソリューションの大手プロバイダー ...

AI 導入を迅速に進める 5 つの方法

重要な実現技術である AI の急速な成功により、より広範なデジタル変革とイノベーションの取り組みへの...

量子もつれによりホログラムが生成されます。物体は画像を形成するために光を放射する必要はありません。

新たな研究によると、量子力学は科学者が物体から光を捉えることなくホログラムを生成するのに役立つ可能性...

K 分割交差検証とグリッドサーチ

みなさんこんにちは、私はZhibinです〜今日は、GridSearch グリッド検索と K 分割相互...

...

国連の高レベル人工知能諮問機関が設立され、曽毅と張玲漢が専門家グループのメンバーに選ばれた。

国連のアントニオ・グテーレス事務総長は現地時間10月26日、ニューヨークの国連本部で、AIがもたらす...