Nvidia、Hugging Face、ServiceNow がコード生成用の新しい StarCoder2 LLM をリリース

Nvidia、Hugging Face、ServiceNow がコード生成用の新しい StarCoder2 LLM をリリース

現在 3 つの異なるサイズで提供されているこれらのモデルは、リソースの少ない言語を含む 600 以上のプログラミング言語でトレーニングされており、企業が開発ワークフローでさまざまなコード関連タスクを高速化するのに役立ちます。これらのモデルは、大規模コード言語モデルの責任ある開発と使用を保証するために ServiceNow と Huging Face が共同で取り組んでいるオープンな BigCode プロジェクトの下で開発されており、Open Responsible AI License の下で無料で利用できます。

StarCoder2 は、オープンな科学的コラボレーションと責任ある AI 実践を倫理的なデータ サプライ チェーンと組み合わせることで得られる威力を実証しています。 ServiceNow の StarCoder2 開発チームのリーダーであり、BigCode の共同リーダーでもあるハーム・デ・フリース氏は声明で、最先端のオープン アクセス モデルは、以前の GenAI 機能を改善して開発者の生産性を高め、コード生成 AI の利点を開発者に平等に提供することで、あらゆる規模の企業がビジネスの可能性を最大限に発揮しやすくなると述べています。

StarCoder2: 3つの異なるニーズに対応する3つのモデル

BigCode の StarCoder LLM の最初のリリースでは、パラメータが 150 億個しかなく、約 80 種類のプログラミング言語でトレーニングされていましたが、最新世代ではそれを超え、30 億、70 億、150 億の 3 つの異なるモデル サイズでリリースされ、619 種類のプログラミング言語でトレーニングされています。 BigCodeによると、「Stack」と呼ばれる新しいモデルは、前回使用されたときよりも7倍以上大きいデータでトレーニングされたという。

さらに、BigCode コミュニティは、最新世代の新しいトレーニング手法を使用して、モデルが COBOL、数学、手続き型ソースコードディスカッションなどのリソースの少ないプログラミング言語を理解し、生成できるようにしました。

最小の 30 億パラメータ モデルは ServiceNow の Fast LLM フレームワークを使用してトレーニングされ、7B モデルは Huging Face の Nantron フレームワークを使用して開発されました。どちらも、少ないコンピューティングで高性能なテキストからコードへの生成とテキストからワークフローへの生成を提供するように設計されています。

一方、最大の 150 億パラメータ モデルは、エンドツーエンドの NVIDIA Nemo クラウド ネイティブ フレームワークと NVIDIA TensorRT-LLM ソフトウェアを使用してトレーニングおよび最適化されました。

これらのモデルがさまざまなエンコード シナリオでどの程度の性能を発揮するかはまだ不明ですが、両社は、最小の 3B モデルがオリジナルの 15B StarCoder LLM と同等の性能を発揮すると述べています。

エンタープライズ チームは、ニーズに応じてこれらのモデルのいずれかを使用し、さまざまなユース ケースのエンタープライズ データに基づいてさらに微調整することができます。ユース ケースには、アプリケーションのソース コード生成、ワークフロー生成、テキスト要約から、コード補完、高度なコード要約、コード スニペットの取得まで、あらゆる特殊なタスクが含まれます。

両社は、これらのモデルはより広範かつ深くトレーニングされており、リポジトリのコンテキストを提供することで、正確でコンテキストを意識した予測が可能になると強調した。最終的には、これらすべてにより開発が高速化され、エンジニアや開発者の時間が解放され、より重要なタスクに集中できるようになります。

「すべてのソフトウェアエコシステムには独自のプログラミング言語があるため、CodeLLM はあらゆる業界で効率性と革新性において飛躍的な進歩をもたらすことができます」と、Nvidia の応用研究担当副社長、ジョナサン・コーエン氏はプレス声明で述べています。

「NVIDIA と ServiceNow および Huging Face の連携により、安全で責任ある開発モデルが導入され、責任ある GenAI へのより広範なアクセスがサポートされ、世界中の社会に利益をもたらすことを期待しています」と同氏は付け加えた。

StarCoder2 の使用を開始するにはどうすればよいですか?

前述のとおり、StarCoder2 コレクションのすべてのモデルは Open Rail-M ライセンスに基づいて提供されており、ロイヤリティフリーのアクセスと使用が可能です。サポートコードは、BigCode プロジェクトの GitHub リポジトリにあります。別の選択肢として、チームはフェイスハガーの 3 つのモデルすべてをダウンロードして使用することもできます。

とはいえ、NVIDIA がトレーニングした 150 億のモデルは NVIDIA AI Foundation でも利用可能になり、開発者はブラウザーから直接、または API エンドポイントを通じてそれらのモデルを試すことができます。

StarCoder は AI 駆動型コード生成の分野に初めて参入した企業ではありませんが、プロジェクトの最新世代によってもたらされた幅広いオプションにより、企業はアプリケーション開発で LLMS を活用しながら、コンピューティングコストを節約できるようになります。

この分野の他の注目企業としては、GitHub フェデレーション パイロット サービスを支える Codex を提供する OpenAI や、CodeWhisper ツールを提供する Amazon などがある。また、Hugging Face にいくつかの小規模な AI コーディング モデルを持つ Replit や、​​最近シリーズ B の資金調達で 5 億ドルの評価額で 6,500 万ドルを調達した Codenium との激しい競争もある。

<<:  AIとERPが出会うとどんな「化学反応」が起こるのでしょうか?

>>:  施設管理の未来: 2024 年までの業界動向

ブログ    
ブログ    
ブログ    

推薦する

Reddit で高く評価:機械学習分野における「8つの大罪」!査読は変化し、偶像崇拝が蔓延している

最近、Reddit コミュニティで機械学習の分野を批判する記事が白熱した議論を巻き起こし、3.1k ...

百度脳産業イノベーションフォーラムが深圳に移転、今回はAIを活用して不動産イノベーションを支援

AIは新たな産業変革の中核的な原動力となっています。生活のあらゆる分野が人工知能によって変革され、ア...

チャットボットの機械学習セキュリティの重要性

人工知能は、大手テクノロジー企業、新興企業、大学の研究チームによって推進されている成長産業です。 A...

2024 年のデータ テクノロジーのトレンド: 基礎モデルと機密コンピューティング

おそらく、現代のデータ環境を形作る最大の力は、基礎となるモデルの遍在性です。これらのモデルは、外部の...

...

20万人を超える人々が請願し、MITとハーバード大学が米国政府を訴えています。

米国移民関税執行局の最近の新しい規制は、アメリカのトップ大学の間で騒動を引き起こしている。ハーバード...

企業に適応型 AI を実装するにはどうすればよいでしょうか?

人工知能はもはや企業にとって選択肢ではありません。すぐに、それも差別化要因ではなくなるでしょう。ビジ...

病院が救急科で人工知能を使用する場合、何を考慮すべきでしょうか?

RapidAI の Mary Hardcastle がヘルスケア技術の進歩を検討し、病院が救急治療...

アルゴリズムがバグをキャッチ:ディープラーニングとコンピュータービジョンが昆虫学を変える

[[390223]]導入コンピュータ アルゴリズムは、ソフトウェア プログラムのバグを検出するのに役...

世界はとても広い。AIがあなたと一緒に世界を旅します

[オリジナル記事は51CTO.comより] 私の周りには、「世界は広いから、外に出て旅をしたい」と言...

人工知能が他に何ができるか知りたいですか?明確な「ベイジアン意識」を持たなければならない

私たちとの会話の中で、多くの読者が、人工知能が予想外の多くのことを実行できることに驚いたと述べていま...

今後10年の予測レポート:高齢化が進み、幼児市場が縮小、AIが様々な製品に浸透

IDCはこのほど、2019年および今後10年間の中国の情報通信分野と技術応用に関するトップ10予測を...

...

2021 年の人工知能のトップ 10 トレンド

コロナウイルスのパンデミック以前、AI業界は2020年に大きな成長を遂げると予想されていました。 2...

チャットボットはデータセンターをよりスリムで効率的にする

自然言語処理 (NLP) の進歩により、データセンターの運用コストの削減や人材の維持率の向上など、デ...