マイクロソフト、精度を80%以上に向上させるAIコードレビューツールを発表

マイクロソフト、精度を80%以上に向上させるAIコードレビューツールを発表

Microsoft は、大規模言語モデルのパフォーマンスを向上させる新しいツール、Jigsaw を発表しました。 「大規模な事前トレーニング済み言語モデル(GPT-3、Codex など)は、プログラマーの意図の自然言語仕様からコードを生成するように調整できます。このような自動化モデルは、世界中のすべてのプログラマーの生産性を向上させる可能性があります。ただし、これらのモデルはプログラムの意味を理解するのが難しい場合があるため、生成されたコードの品質は保証されません。」

紹介文によると、Jigsaw は後処理技術を導入してプログラムの構文とセマンティクスを理解し、ユーザーからのフィードバックを使用して将来のパフォーマンスを向上させます。このツールは、マルチモーダル入力を使用して Python Pandas API のコードを合成するように設計されています。 Pandas はデータ サイエンスで広く使用されている API で、データフレーム (行と列を持つテーブル) を操作するための数百の機能を備えています。

マイクロソフトは、自社の経験から、これらの大規模な言語モデルが意図に基づいてコードを合成するように進化するにつれて、Jigsaw がシステムの精度向上に重要な役割を果たすことができることが示されていると述べた。

OpenAI の Codex のような大規模な言語モデルは、プログラミングの分野を再定義しています。プログラミングタスクを解決する際に、ソフトウェア開発者は予想されるコードスニペットの英語の説明を提供することができ、Codex は予想されるコードを Python や JavaScript などの言語で合成できます。ただし、合成されたコードが正しくなかったり、コンパイルや実行すらできない可能性があります。 Codex ユーザーは、コードを使用する前にそれを確認する責任があります。 Jigsaw チームは、Project Jigsaw の目標はレビューの一部を自動化し、コード合成に Codex などの大規模な言語モデルを使用する開発者の生産性を向上させることだと説明しました。

Microsoft によれば、Jigsaw は、コードがコンパイルされるかどうかのチェック、エラー メッセージの処理、コードが開発者の期待どおりの出力を生成するかどうかのテストというプロセス全体を「完全に自動化」できるという。 「Jigsaw は、期待されるコードの英語の説明と I/O の例を入力として受け取ります。このようにして、入力と関連する出力をペアにして、出力 Python コードが提供された入力でコンパイルされ、期待される出力を生成するという品質保証を提供します。」

Microsoft は、ICSE 2022 の論文「Jigsaw: Large Language Models meet Program Synthesis」で、このアプローチを Python Pandas で評価しました。 Jigsaw を使用すると、ユーザーは予想される変換、入力データフレーム、および対応する出力データフレームの英語の説明を提供し、Jigsaw に予想されるコードを合成させることができます。

Jigsaw は英語のクエリを受け取り、適切なコンテキストで前処理して、大規模な言語モデルに入力できる入力を構築します。 Microsoft は実験で、Jigsaw が 30% の確率で正しい出力を作成できることを発見しました。コードが失敗した場合、後処理フェーズで修復プロセスが開始されます。

後処理中に、Jigsaw は 3 つの変換を適用してコードを修復します。これらの変化は、GPT-3 と Codex で観察された失敗パターンによって動機付けられました。 GPT-3 と Codex はどちらも同様の方法で失敗するため、これらの障害モードに対処するための Jigsaw の後処理はどちらにも役立ちます。

Microsoft は、さまざまなデータセットで Codex と Jigsaw (Codex を使用) を評価し、精度を測定しました。 Codex は初期状態で約 30% の精度を提供しますが、Jigsaw ではそれが 60% 以上に向上します。ユーザーからのフィードバックにより、80% 以上に向上できます。次に、彼らは Jigsaw の改善に取り組み続け、Python Pandas API のエクスペリエンスを他の API や他の言語に拡張することを目指し、自動化を通じてプログラマーの生産性を向上させる上で重要な役割を果たします。

詳細は公式ブログをご確認ください。

この記事はOSCHINAから転載したものです

この記事のタイトル: Microsoft が精度を 80% 以上に向上できる AI コードレビュー ツールをリリース

記事のURL: https://www.oschina.net/news/190978/microsoft-jigsaw-ai-code-fix

<<:  オピニオン:ソーシャルロボットはニューノーマルの中で急速に発展している

>>:  転移学習に関する最先端の研究:低リソース、ドメイン一般化、安全な転移

ブログ    

推薦する

Googleの上級研究員が解雇される:論文論争の裏側

[51CTO.com クイック翻訳] 12月初旬、Googleは著名なAI倫理研究者のティムニット・...

サイバーセキュリティにおける機械学習:課題と比較

デジタルでつながった時代において、サイバーセキュリティ防御における機械学習 (ML) の役割は不可欠...

ファーウェイクラウドが年間人工知能リストで3つの賞を受賞

このほど、Synced Machine Intelligenceが主催する「AI China」Syn...

...

上位985大学の「人工知能」関連学部・専攻一覧!ぜひ集めてみてください!

今最もホットな分野といえば、間違いなく「人工知能」でしょう。給与面でも人材ギャップの面でも、この分野...

GPU + 生成AIが時空間データ分析の改善に貢献

翻訳者|朱 仙中レビュー | Chonglou導入携帯電話、気候センサー、金融市場取引、車両や輸送コ...

...

トレーニング速度は 3D CNN よりもはるかに速く、3 倍高速です。トランス

[[388464]] Facebook AI は、新しいビデオ理解アーキテクチャ TimeSform...

...

内部テスト中です! Word、Excel、Outlookに機械学習が搭載される

マイクロソフトは、機械学習を使用して人々がより効率的に仕事を遂行できるよう支援する、多数の新機能を ...

生成型AIの7つの秘密

誇大宣伝されているかどうかは別として、人工知能アルゴリズムの可能性は依然として有望です。しかし、今日...

...

自動運転に関する毎年恒例の議論:量産化は3つの要因によって推進され、その本質はデータ軍拡競争である

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

産業AI戦略を成功させる3つの鍵

今日、工業製造業は産業用人工知能への依存度が高まっており、業務上の意思決定者はこれをデジタル変革戦略...