コーダーの皆さん、おめでとうございます!マイクロソフトは、LLMを使用して168のコードベースにわたるコーディングタスクを自動化するCodePlanを提案している。

大規模なモデルの場合、ローカライズされたエンコードタスクに優れています。

しかし、タスクが複数の相互依存ファイルにまたがる場合、LLM では解決できません。

これに応えて、Microsoft の研究者は、CodePlan と呼ばれるタスクに依存しないニューラルネットワークフレームワークを設計しました。

写真

論文アドレス: https://arxiv.org/pdf/2309.12499.pdf

この論文では、CodePlan は、プログラム分析、計画、LLM を組み合わせた新しいアプローチである、複数ステップの編集チェーンを統合しています。

CodePlan がどのように設計されているかを詳しく見てみましょう。

CodePlan: ビッグモデル + プランニング

パッケージの移行、静的分析またはテストからのバグレポートの修正、コードベースへの型ヒントやその他の仕様の追加などのソフトウェアエンジニアリングアクティビティには、コードリポジトリ全体の広範な編集が伴います。

研究者たちはこれらの活動を「リポジトリレベルのエンコーディングタスク」と定義しました。

GitHub Copilot や Code Whisperer などのコーディングツールには大規模なモデル機能が搭載されているため、プログラマーがローカライズされたコーディングの問題を解決するためのソリューションを提供しています。

しかし、現実には、リポジトリレベルのコーディングタスクはより複雑であり、リポジトリ内のコードは相互に依存しており、リポジトリ全体がヒントに含めるには大きすぎる可能性があるため、LLM では直接解決できません。

この研究では、Microsoft チームはライブラリレベルのコーディングを計画の問題として捉え、CodePlan と呼ばれるタスクに依存しないフレームワークを提案しました。

CodePlan は、複数のステップの編集チェーン (プラン) を組み合わせ、各ステップでコードの場所にある LLM を呼び出します。そのコードの場所のコンテキストは、リポジトリ全体、以前のコード変更、およびタスク固有の指示から取得されます。

CodePlan は、増分依存性分析、変更影響分析、および適応型計画アルゴリズムの新しい組み合わせに基づいています。

写真

下の図に示すように、複雑なライブラリ API の変更点が示されています。Microsoft の研究者の作業は、この変更に応じてコードベースを移行することです。

写真

図 3 の左側は、複素数ライブラリを使用するコードベースの関連部分を示しています。

具体的には、Create.cs ファイル内のメソッド func はライブラリ内の create_complex メソッドを呼び出し、Process.cs ファイル内のメソッド Process.cs は func を呼び出します。

写真

研究者は、図 1 のタスク記述と func 本体を LLM に渡して、図 3 の右側に示すように、変更された func コードを生成しました。

ご覧のとおり、LLM は create_complex API の呼び出しを正しく編集し、2 つの浮動小数点値のタプルではなく Complex 型のオブジェクトを返すようにしました。

この編集により、メソッド func のシグネチャが変更され、Complex 型のオブジェクトが返されるようになったことに注意してください。

これには、図 3 の左下隅に示すように、Process.cs の process メソッドなど、メソッド func の呼び出し元を変更する必要があります。プロセスメソッドの本体に適切な変更を加えないと、コードはビルドされません。

図 3 の右下には、プロセスメソッドを適切に変更した例が示されています。これにより、リポジトリを一貫した状態にして、コンパイル時にエラーが発生しないようにすることができます。

研究者にとって重要なことは、編集に必要な派生仕様を自動的に生成できる「リポジトリレベルのエンコーディングシステム」を構築することです。

LLM によって駆動されるライブラリレベルのエンコーディングタスクは次のように定義されます。

写真

CodePlan フレームワークでは、入力はリポジトリ、自然言語命令または一連の初期コード編集を通じてシード仕様を表現するタスク、正確性オラクル、および LLM です。

CodePlan は、各ノードが LLM が満たす必要のあるコード編集義務を識別し、エッジがソースノードの後にターゲットノードを満たす必要があることを示すプラングラフを構築します。

CodePlan はコードの編集を監視し、プラングラフを適応的に拡張します。

計画のすべてのステップが完了すると、リポジトリは Oracle によって分析されます。 Oracle がリポジトリを検証すると、タスクは完了します。エラーが見つかった場合、エラーレポートは次回のプラン生成および実行のシード仕様として機能します。

写真

さらに、CodePlan アルゴリズムは依存関係グラフも維持します。図 4 は依存関係グラフの構造を示しています。

写真

SOTA をリフレッシュ

研究者らは、パッケージ移行 (C#) と一時的なコード編集 (Python) という 2 つのリポジトリレベルのタスクにおける CodePlan の有効性を評価しました。

各タスクは複数のコードベースで評価され、各コードベースでは複数のファイル (2 ～ 97 ファイル) への相互依存的な変更が必要になります。

写真

これまで、これほど複雑なコーディングタスクは LLM を使用して自動化されたことはありませんでした。

結果は、CodePlan がベースラインよりも真実と一致しており、エラーのないビルドや正しいコード編集などの有効性チェックに 5/6 のリポジトリが合格できることを示しています。

要約すると、CodePlan は、複雑なライブラリレベルのコーディングタスクを自動化し、生産性と精度の両方を向上させる有望なアプローチを提供します。

多くの課題にうまく対処し、効率的で信頼性の高いソフトウェアエンジニアリングプラクティスの新たな可能性を切り開きます。

参考: https://twitter.com/adityakanade0/status/1706291449674039711

<<:

>>: ICCV'23論文表彰式は「神々の戦い」！ Meta Split EverythingとControlNetが両方とも選出され、審査員を驚かせた記事がもう一つありました

コーダーの皆さん、おめでとうございます!マイクロソフトは、LLMを使用して168のコードベースにわたるコーディングタスクを自動化するCodePlanを提案している。

CodePlan: ビッグモデル + プランニング

SOTA をリフレッシュ

2020 年の機械学習の 5 つのトレンド

2021年の中国AI音声認識産業の市場現状と発展見通しの分析

AIチップとは何ですか?人々が知っておくべきことすべて

ガートナーが短期的なAIイノベーションを推進する4つのトレンドを明らかに

人工知能はクラウドストレージとデータサービスの革新を推進する

100日間人工知能について学んだ後、私は次の5つの結論に達しました

Javaの組み込みソートアルゴリズムをどうやって克服したか

AIは英語のエッセイを添削できますか？ IELTS、CET-4、CET-6の採点、コメント、エラー修正が必要です

自動運転の未来 - 4Dミリ波レーダー

推薦する

あなたの脳は寝ている間に本当に学習します！初めての人間実験証拠：再生速度が1～4倍に

Google、視覚障害者が世界を見るのを助けるAIメガネを開発

初心者に適した機械学習アルゴリズムの選び方

コンテンツマーケティングにおいて自然言語処理はどのように機能しますか?

ナレッジグラフをビッグモデルの仲間にしよう

人工知能チップの過去、現在、そして未来

AI リサーチインスティテュートが 2021 年の AI 技術トレンドトップ 10 を発表

ウー・ジアン：nEqual は、優れたユーザーエクスペリエンスで企業がスマートなビジネスを構築できるよう支援します

ビデオ分析以外に、AI と機械学習はどのようなメリットをもたらすのでしょうか?

人工知能がサービスと運用管理を改善する10の方法

ControlNetの作者が新作を発表：数百万のデータを使ったトレーニング、レイヤー設計の先駆けとなるAI画像生成

4 つの主要ビジネス分野における業界に関するインテルの詳細な洞察、アプリケーション事例、革新的な製品とソリューションの解釈 | Intel Vision