清華大学の「自然言語プログラミング成果物」が利用可能になりました! 100以上のプログラミング言語をサポートし、効率性が向上しました

清華大学の「自然言語プログラミング成果物」が利用可能になりました! 100以上のプログラミング言語をサポートし、効率性が向上しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

清華大学とZhipu AIが共同開発した多言語コード生成モデル「CodeGeeX」がアップデートされました!

サポートするプログラミング言語の数は20から100以上に増加しました

IDE のプラグインを通じて、「シームレスな自然言語プログラミング」を簡単に実現できます。

写真

CodeGeeX2 は、基本モデルの新しいバージョンを使用しているため、さらに強力です。

この新しいバージョンの精度と速度はそれぞれ元のバージョンの 2 倍と 3 倍になっていますが、メモリ消費量は 1/5 しかありません。

コード生成、解釈、翻訳、エラー修正、プログラミングQ&Aなどの作業の効率が以前に比べて大幅に向上しました。

私たちは「クラス代表」として、CodeGeeX のアップデートを次の側面にまとめました。

  • コーディングスキルの向上
  • モデル特性が最適化されました
  • AIプログラミングアシスタントはより包括的な機能を備えています
  • ユーザー契約はよりオープンに

プラグインのバージョンも完全に更新されます

モデルは使用するには複雑すぎますか?問題ありません。モデル自体のアップデートに加えて、CodeGeeX のプラグイン バージョンもまもなく新しいバージョンに完全にアップグレードされます。

新しいプラグインは 100 を超えるプログラミング言語もサポートしており、おそらく私たちが知っているよりも多くなっています。

これらには、Python や Java などの私たちがよく知っている言語に加えて、Swift や Kotlin などの新興のモバイル フォースも含まれます。

Rust のようなシステムレベルのプログラミング言語も CodeGeeX2 の機能の範囲内です。

たとえば、次のアニメーション画像は、CodeGeeX2 が Kotlin コードを生成するシーンを示しています。

写真

コードの生成速度は、人間が命令を入力する速度とほぼ同じです。

このことから、CodeGeeX2 では 1 回のクリックでコメントを追加したりデバッグしたりできることがわかります。

アルゴリズムの設計だけでなく、ユーティリティの作成も簡単です。

vue.js コードを完成させて、効率的に Web ページを構築しましょう。

写真

これらのコード関連のタスクに加えて、CodeGeeX2 には他の多くのアプリケーション シナリオがあります。

たとえば、SQL データベースをクエリします。

質問と回答モードを開いて、クエリするコンテンツを自然言語で記述するだけで、CodeGeeX2 が自動的に SQL クエリ ステートメントを生成します。

写真

モデルがさらに強力になった後、料金は発生しますか?ご心配なく、CodeGeeX プラグインの新しいバージョンは、個人ユーザー向けに引き続き無料で提供されます

6B パラメータ CodeGeeX2 もオープンソース化されており、関連コードは GitHub リポジトリで閲覧できます。

GitHub Copilotのモデルも及ばない

OpenAI の HumanEval 評価標準は、生成されたコードのパフォーマンスを適切に評価できます。

名前の通り、モデルによって生成されたコードの品質は人間によって評価されます。

HumanEval の評価では、60 億のパラメータを持つ CodeGeeX2 のスコアが150 億のパラメータを持つ StarCoder モデルのスコアよりも高く、小さな努力で大きな成果が得られたと言えます。

GitHub Copilot で使用される Code-Cushman-001 モデルも CodeGeeX2 には匹敵しません。

ただし、CodeGeeX は結局のところ多言語モデルであるのに対し、HumanEval は Python のみをサポートしています。

そこで、CodeGeeXのパフォーマンスをより正確にテストするために、ZhipuチームはGo、C++、Java、JSの4つの言語のテストデータを追加して、HumanEval-Xデータセットを取得しました。

結果は、複数の言語に関して、CodeGeeX2 の新しいバージョンが Python と同様に機能することを示しています。

第一世代と比較して、 CodeGeeX2のPass@1インジケーターのさまざまな言語での平均パフォーマンスは107%向上しました

その中で、 Rust 言語のパフォーマンスは 321% と大幅に向上しました。C++ および JS 言語のパフォーマンスも 70% 以上向上しました。

コード変換の点でも、CodeGeeX2 は競合他社よりも優れています。

「広告を見るのではなく、結果を見てください。」CodeGeeX は優れたテスト結果だけでなく、ユーザーからの認知度も高くなっています。

「CodeGeeX はプログラミング効率を向上させますか?」という質問に対して、 83.4% のユーザーが肯定的な回答をしました

調査結果に加えて、ユーザーも「足で投票」している。

最初のバージョンがリリースされて以来、CodeGeeX は 120,000 回ダウンロードされ、平均して 1 日あたり約 1,000 万行のコードが生成されています。

これのコンセプトは何ですか?コードの行数だけ見ると、これは 1 週間未満で Windows XP のバージョンを作成するのと同等です。

ここまで述べてきましたが、CodeGeeX を体験するにはどうすればよいでしょうか?

クイック体験

最初の方法は、VScode および JetBrains シリーズ IDE のプラグイン リポジトリに含まれている IDE 内のプラグインです。

IDE でプラグインを使用するだけでなく、CodeGeeX を Transformer ですばやく呼び出すこともできます。

 from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("THUDM/codegeex2-6b", trust_remote_code=True) model = AutoModel.from_pretrained("THUDM/codegeex2-6b", trust_remote_code=True, device='cuda') model = model.eval() # remember adding a language tag for better performance prompt = "# language: python\n# write a bubble sort function\n" inputs = tokenizer.encode(prompt, return_tensors="pt").to(model.device) outputs = model.generate(inputs, max_length=256, top_k=1) response = tokenizer.decode(outputs[0]) >>> print(response) # language: python # write a bubble sort function

対応しているIDEも無く、Transformerも面倒そうだけど、試してみたい。どうすればいいでしょうか?

問題ありません。オンライン版のデモもここにあります。

ポータル: https://codegeex.cn/zh-CN/playground

今すぐ「シームレスな自然言語プログラミング」を体験してみましょう!

論文アドレス: https://arxiv.org/abs/2303.17568
Github プロジェクトページ: https://github.com/THUDM/CodeGeeX2
Hugging Face プロジェクトページ: https://huggingface.co/THUDM/codegeex2-6b

<<:  自動運転 AI に「プラグイン」を与えると、0.1M で動作状態を区別する能力が大幅に向上します (HKU および TCL より) | オープンソース

>>:  WebGPT について簡単に説明してください。学びましたか?

ブログ    
ブログ    
ブログ    

推薦する

...

...

人工知能技術をより効果的に応用するにはどうすればよいでしょうか?より正確かつ迅速に行う5つの方法

広範囲にわたるモデリングと10万回以上のシミュレーションの実行を経て、AIシステムが2018年ワール...

AIエンジニアリングのためのJavaScriptツールトップ5

多くの人が驚くことに、Web 開発の分野で常に人気がある JavaScript は、大規模言語モデル...

最大フロー問題の解決における画期的な進歩: 新しいアルゴリズムは「驚くほど高速」

この問題はネットワークフロー理論において非常に基本的なものです。 「新しいアルゴリズムは驚くほど高速...

人工知能は宇宙人を発見するのに役立つかもしれない

米国の宇宙ウェブサイトによると、多くの科学者が人工知能(AI)を使ってエイリアン(学名は「地球外知的...

AI によって自動化された、誰でも使えるオンライン写真編集!北京大学の卒業生がアルゴリズムを新たな高みへ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Google Brainの主要研究:高速微分可能ソートアルゴリズム、桁違いに高速

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

効率的な多次元空間ポイントインデックスアルゴリズム - Geohash と Google S2

[[201793]]導入毎晩残業して家に帰るときは、Didiやシェア自転車を使うこともあります。ア...

この世界的に有名な旅行ウェブサイトは、150の独自の機械学習モデルを分析し、6つの教訓を学びました。

多くのメディア記事では、「機械学習がXX業界に力を与える」という言葉を目にしますが、この「エネルギー...

なぜマスク氏の新しい「脳コンピューターインターフェース」は大きな進歩なのでしょうか?

昨日のマスク氏の発表を見た後、サイバーパンク映画をたくさん思い出し、一晩中夢を見ました。北京時間の昨...

浅いモデルから深いモデルへ: 機械学習最適化アルゴリズムの概要

論文リンク: https://arxiv.org/abs/1706.10207概要: この論文では、...

軽量で大規模な機械学習アルゴリズムライブラリ Fregata オープンソース: 高速、パラメータ調整不要

1. 大規模機械学習の課題インターネットとモバイルインターネットの普及により、利用可能なデータの量は...

「アルゴリズムとデータ構造」トライ木の美しさ

[[349418]]序文今回紹介するトライ辞書ツリーは、データ構造トピックの分岐です。トライのツリー...

Keras を使用して、30 行未満のコードで最初のニューラル ネットワークを記述します。

[51CTO.com クイック翻訳] 私が初めて AI に触れたときのことを振り返ると、いくつかの...