清華大学の「自然言語プログラミング成果物」が利用可能になりました! 100以上のプログラミング言語をサポートし、効率性が向上しました

清華大学の「自然言語プログラミング成果物」が利用可能になりました! 100以上のプログラミング言語をサポートし、効率性が向上しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

清華大学とZhipu AIが共同開発した多言語コード生成モデル「CodeGeeX」がアップデートされました!

サポートするプログラミング言語の数は20から100以上に増加しました

IDE のプラグインを通じて、「シームレスな自然言語プログラミング」を簡単に実現できます。

写真

CodeGeeX2 は、基本モデルの新しいバージョンを使用しているため、さらに強力です。

この新しいバージョンの精度と速度はそれぞれ元のバージョンの 2 倍と 3 倍になっていますが、メモリ消費量は 1/5 しかありません。

コード生成、解釈、翻訳、エラー修正、プログラミングQ&Aなどの作業の効率が以前に比べて大幅に向上しました。

私たちは「クラス代表」として、CodeGeeX のアップデートを次の側面にまとめました。

  • コーディングスキルの向上
  • モデル特性が最適化されました
  • AIプログラミングアシスタントはより包括的な機能を備えています
  • ユーザー契約はよりオープンに

プラグインのバージョンも完全に更新されます

モデルは使用するには複雑すぎますか?問題ありません。モデル自体のアップデートに加えて、CodeGeeX のプラグイン バージョンもまもなく新しいバージョンに完全にアップグレードされます。

新しいプラグインは 100 を超えるプログラミング言語もサポートしており、おそらく私たちが知っているよりも多くなっています。

これらには、Python や Java などの私たちがよく知っている言語に加えて、Swift や Kotlin などの新興のモバイル フォースも含まれます。

Rust のようなシステムレベルのプログラミング言語も CodeGeeX2 の機能の範囲内です。

たとえば、次のアニメーション画像は、CodeGeeX2 が Kotlin コードを生成するシーンを示しています。

写真

コードの生成速度は、人間が命令を入力する速度とほぼ同じです。

このことから、CodeGeeX2 では 1 回のクリックでコメントを追加したりデバッグしたりできることがわかります。

アルゴリズムの設計だけでなく、ユーティリティの作成も簡単です。

vue.js コードを完成させて、効率的に Web ページを構築しましょう。

写真

これらのコード関連のタスクに加えて、CodeGeeX2 には他の多くのアプリケーション シナリオがあります。

たとえば、SQL データベースをクエリします。

質問と回答モードを開いて、クエリするコンテンツを自然言語で記述するだけで、CodeGeeX2 が自動的に SQL クエリ ステートメントを生成します。

写真

モデルがさらに強力になった後、料金は発生しますか?ご心配なく、CodeGeeX プラグインの新しいバージョンは、個人ユーザー向けに引き続き無料で提供されます

6B パラメータ CodeGeeX2 もオープンソース化されており、関連コードは GitHub リポジトリで閲覧できます。

GitHub Copilotのモデルも及ばない

OpenAI の HumanEval 評価標準は、生成されたコードのパフォーマンスを適切に評価できます。

名前の通り、モデルによって生成されたコードの品質は人間によって評価されます。

HumanEval の評価では、60 億のパラメータを持つ CodeGeeX2 のスコアが150 億のパラメータを持つ StarCoder モデルのスコアよりも高く、小さな努力で大きな成果が得られたと言えます。

GitHub Copilot で使用される Code-Cushman-001 モデルも CodeGeeX2 には匹敵しません。

ただし、CodeGeeX は結局のところ多言語モデルであるのに対し、HumanEval は Python のみをサポートしています。

そこで、CodeGeeXのパフォーマンスをより正確にテストするために、ZhipuチームはGo、C++、Java、JSの4つの言語のテストデータを追加して、HumanEval-Xデータセットを取得しました。

結果は、複数の言語に関して、CodeGeeX2 の新しいバージョンが Python と同様に機能することを示しています。

第一世代と比較して、 CodeGeeX2のPass@1インジケーターのさまざまな言語での平均パフォーマンスは107%向上しました

その中で、 Rust 言語のパフォーマンスは 321% と大幅に向上しました。C++ および JS 言語のパフォーマンスも 70% 以上向上しました。

コード変換の点でも、CodeGeeX2 は競合他社よりも優れています。

「広告を見るのではなく、結果を見てください。」CodeGeeX は優れたテスト結果だけでなく、ユーザーからの認知度も高くなっています。

「CodeGeeX はプログラミング効率を向上させますか?」という質問に対して、 83.4% のユーザーが肯定的な回答をしました

調査結果に加えて、ユーザーも「足で投票」している。

最初のバージョンがリリースされて以来、CodeGeeX は 120,000 回ダウンロードされ、平均して 1 日あたり約 1,000 万行のコードが生成されています。

これのコンセプトは何ですか?コードの行数だけ見ると、これは 1 週間未満で Windows XP のバージョンを作成するのと同等です。

ここまで述べてきましたが、CodeGeeX を体験するにはどうすればよいでしょうか?

クイック体験

最初の方法は、VScode および JetBrains シリーズ IDE のプラグイン リポジトリに含まれている IDE 内のプラグインです。

IDE でプラグインを使用するだけでなく、CodeGeeX を Transformer ですばやく呼び出すこともできます。

 from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("THUDM/codegeex2-6b", trust_remote_code=True) model = AutoModel.from_pretrained("THUDM/codegeex2-6b", trust_remote_code=True, device='cuda') model = model.eval() # remember adding a language tag for better performance prompt = "# language: python\n# write a bubble sort function\n" inputs = tokenizer.encode(prompt, return_tensors="pt").to(model.device) outputs = model.generate(inputs, max_length=256, top_k=1) response = tokenizer.decode(outputs[0]) >>> print(response) # language: python # write a bubble sort function

対応しているIDEも無く、Transformerも面倒そうだけど、試してみたい。どうすればいいでしょうか?

問題ありません。オンライン版のデモもここにあります。

ポータル: https://codegeex.cn/zh-CN/playground

今すぐ「シームレスな自然言語プログラミング」を体験してみましょう!

論文アドレス: https://arxiv.org/abs/2303.17568
Github プロジェクトページ: https://github.com/THUDM/CodeGeeX2
Hugging Face プロジェクトページ: https://huggingface.co/THUDM/codegeex2-6b

<<:  自動運転 AI に「プラグイン」を与えると、0.1M で動作状態を区別する能力が大幅に向上します (HKU および TCL より) | オープンソース

>>:  WebGPT について簡単に説明してください。学びましたか?

ブログ    
ブログ    
ブログ    

推薦する

世界のトラフィック量上位50のAIウェブサイトが発表:ChatGPTなどの会話型製品が目立ち、ユーザーは主にライトな体験を利用

米国のベンチャーキャピタル企業a16zは10月9日、Cエンドユーザーに公開されている現在市場に出回っ...

...

新たな突破口!商用ドローン配送がさらに一歩前進

ドローンはすでに、医療製品の配送、インフラの検査、監視、メンテナンス、人間の労働力へのリスクの軽減、...

人工知能は、マルチドメイン畳み込みニューラルネットワークを通じて、JPEG二重圧縮画像内の偽造領域を特定します。

人工知能がマルチドメイン畳み込みニューラル ネットワークを介して JPEG 二重圧縮画像の偽造領域を...

ディープフェイクの検出が得意なのは誰でしょうか?人間か機械か?

翻訳者 |陳俊レビュー | Chonglou Deepfakesと呼ばれる詐欺アプリをご存知ですか?...

...

...

AIの実践、Pythonを使って自動運転を体験しよう!

設置環境Gym は、強化学習アルゴリズムの開発と比較のためのツールキットです。gym ライブラリとそ...

...

GenAI が CIO にとって悪夢である理由とその解決方法

GenAI が現代の企業にとって非常に魅力的な理由は理解できます。これは、世界中のさまざまな業界で無...

企業が人工知能を導入する際に知っておくべき5つの誤解

[[392106]] AI は広く普及しているにもかかわらず、知識と認識のギャップにより、商業的な導...

...

科学者らが世界最小の「カニ」遠隔操作歩行ロボットを公開。ノミよりも小さい

最近、米国ノースウェスタン大学のエンジニアたちが、小さくてかわいいカニの形をした、史上最小の遠隔操作...

ソファがリモコンに変身、PCBが落書きに隠れる、MITの技術オタクのスマートホームはこんな感じ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

建築環境における人工知能:その可能性を実現するためのステップ

AI と自動化により、企業はさまざまな最適化ソフトウェアを使用して、冷房、暖房、発電を自動的に改善し...