マイクロソフト、精度を80%以上に向上させるAIコードレビューツールを発表

マイクロソフト、精度を80%以上に向上させるAIコードレビューツールを発表

Microsoft は、大規模言語モデルのパフォーマンスを向上させる新しいツール、Jigsaw を発表しました。 「大規模な事前トレーニング済み言語モデル(GPT-3、Codex など)は、プログラマーの意図の自然言語仕様からコードを生成するように調整できます。このような自動化モデルは、世界中のすべてのプログラマーの生産性を向上させる可能性があります。ただし、これらのモデルはプログラムの意味を理解するのが難しい場合があるため、生成されたコードの品質は保証されません。」

紹介文によると、Jigsaw は後処理技術を導入してプログラムの構文とセマンティクスを理解し、ユーザーからのフィードバックを使用して将来のパフォーマンスを向上させます。このツールは、マルチモーダル入力を使用して Python Pandas API のコードを合成するように設計されています。 Pandas はデータ サイエンスで広く使用されている API で、データフレーム (行と列を持つテーブル) を操作するための数百の機能を備えています。

マイクロソフトは、自社の経験から、これらの大規模な言語モデルが意図に基づいてコードを合成するように進化するにつれて、Jigsaw がシステムの精度向上に重要な役割を果たすことができることが示されていると述べた。

OpenAI の Codex のような大規模な言語モデルは、プログラミングの分野を再定義しています。プログラミングタスクを解決する際に、ソフトウェア開発者は予想されるコードスニペットの英語の説明を提供することができ、Codex は予想されるコードを Python や JavaScript などの言語で合成できます。ただし、合成されたコードが正しくなかったり、コンパイルや実行すらできない可能性があります。 Codex ユーザーは、コードを使用する前にそれを確認する責任があります。 Jigsaw チームは、Project Jigsaw の目標はレビューの一部を自動化し、コード合成に Codex などの大規模な言語モデルを使用する開発者の生産性を向上させることだと説明しました。

Microsoft によれば、Jigsaw は、コードがコンパイルされるかどうかのチェック、エラー メッセージの処理、コードが開発者の期待どおりの出力を生成するかどうかのテストというプロセス全体を「完全に自動化」できるという。 「Jigsaw は、期待されるコードの英語の説明と I/O の例を入力として受け取ります。このようにして、入力と関連する出力をペアにして、出力 Python コードが提供された入力でコンパイルされ、期待される出力を生成するという品質保証を提供します。」

Microsoft は、ICSE 2022 の論文「Jigsaw: Large Language Models meet Program Synthesis」で、このアプローチを Python Pandas で評価しました。 Jigsaw を使用すると、ユーザーは予想される変換、入力データフレーム、および対応する出力データフレームの英語の説明を提供し、Jigsaw に予想されるコードを合成させることができます。

Jigsaw は英語のクエリを受け取り、適切なコンテキストで前処理して、大規模な言語モデルに入力できる入力を構築します。 Microsoft は実験で、Jigsaw が 30% の確率で正しい出力を作成できることを発見しました。コードが失敗した場合、後処理フェーズで修復プロセスが開始されます。

後処理中に、Jigsaw は 3 つの変換を適用してコードを修復します。これらの変化は、GPT-3 と Codex で観察された失敗パターンによって動機付けられました。 GPT-3 と Codex はどちらも同様の方法で失敗するため、これらの障害モードに対処するための Jigsaw の後処理はどちらにも役立ちます。

Microsoft は、さまざまなデータセットで Codex と Jigsaw (Codex を使用) を評価し、精度を測定しました。 Codex は初期状態で約 30% の精度を提供しますが、Jigsaw ではそれが 60% 以上に向上します。ユーザーからのフィードバックにより、80% 以上に向上できます。次に、彼らは Jigsaw の改善に取り組み続け、Python Pandas API のエクスペリエンスを他の API や他の言語に拡張することを目指し、自動化を通じてプログラマーの生産性を向上させる上で重要な役割を果たします。

詳細は公式ブログをご確認ください。

この記事はOSCHINAから転載したものです

この記事のタイトル: Microsoft が精度を 80% 以上に向上できる AI コードレビュー ツールをリリース

記事のURL: https://www.oschina.net/news/190978/microsoft-jigsaw-ai-code-fix

<<:  オピニオン:ソーシャルロボットはニューノーマルの中で急速に発展している

>>:  転移学習に関する最先端の研究:低リソース、ドメイン一般化、安全な転移

ブログ    
ブログ    

推薦する

NVIDIA、端末デバイスへのディープラーニングの導入を加速する高性能Jetson TX2を発表

人工知能と機械学習はユーザーからますます注目を集めており、AIの応用は徐々に世間の注目を集め始めてい...

AI | 人工知能プロジェクトを成功させるための 8 つの重要な役割

企業が AI プロジェクトをさらに展開するにつれて、特定の役割がビジネスの成功に不可欠であることがわ...

...

...

自動運転車が保険業界に与える影響

自動運転車の急速な発展は、自動車業界や輸送業界を再定義するだけでなく、保険業界にも混乱をもたらすでし...

...

上位985大学の「人工知能」関連学部・専攻一覧!ぜひ集めてみてください!

今最もホットな分野といえば、間違いなく「人工知能」でしょう。給与面でも人材ギャップの面でも、この分野...

ネイチャーが中国のAIの現状を分析。2030年に世界をリードできるか?

ネイチャー誌の最近の分析記事では、中国の人工知能研究は質の面で急速な進歩を遂げているが、影響力の大き...

高校の授業に人工知能が進出。全国40校がこの教材を導入

人工知能が高校の教室に導入されつつあります。最近、我が国初の中学生向けAI教科書『人工知能の基礎(高...

GPT-4は97回の対話で世界の諸問題を探り、P≠NPという結論を導き出した。

科学研究の分野で働く人なら、P/NP 問題についてはある程度聞いたことがあるでしょう。この問題は、ク...

英国最高裁:特許の「発明者」は人工知能ではなく自然人でなければならない

ロイター通信は12月21日、現地時間20日に発表された英国最高裁判所の判決で、米国のコンピューター科...

オタクなおじさんが独学でAIを学んでマスターレベルを作成し、Twitterで人気になった

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2019年にロボット分野で注目すべき5つのトレンド

2019 年に注目すべき 5 つのロボット トレンドは次のとおりです。 [[259551]] 1. ...

...