清華大学の「自然言語プログラミング成果物」が利用可能になりました! 100以上のプログラミング言語をサポートし、効率性が向上しました

清華大学の「自然言語プログラミング成果物」が利用可能になりました! 100以上のプログラミング言語をサポートし、効率性が向上しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

清華大学とZhipu AIが共同開発した多言語コード生成モデル「CodeGeeX」がアップデートされました!

サポートするプログラミング言語の数は20から100以上に増加しました

IDE のプラグインを通じて、「シームレスな自然言語プログラミング」を簡単に実現できます。

写真

CodeGeeX2 は、基本モデルの新しいバージョンを使用しているため、さらに強力です。

この新しいバージョンの精度と速度はそれぞれ元のバージョンの 2 倍と 3 倍になっていますが、メモリ消費量は 1/5 しかありません。

コード生成、解釈、翻訳、エラー修正、プログラミングQ&Aなどの作業の効率が以前に比べて大幅に向上しました。

私たちは「クラス代表」として、CodeGeeX のアップデートを次の側面にまとめました。

  • コーディングスキルの向上
  • モデル特性が最適化されました
  • AIプログラミングアシスタントはより包括的な機能を備えています
  • ユーザー契約はよりオープンに

プラグインのバージョンも完全に更新されます

モデルは使用するには複雑すぎますか?問題ありません。モデル自体のアップデートに加えて、CodeGeeX のプラグイン バージョンもまもなく新しいバージョンに完全にアップグレードされます。

新しいプラグインは 100 を超えるプログラミング言語もサポートしており、おそらく私たちが知っているよりも多くなっています。

これらには、Python や Java などの私たちがよく知っている言語に加えて、Swift や Kotlin などの新興のモバイル フォースも含まれます。

Rust のようなシステムレベルのプログラミング言語も CodeGeeX2 の機能の範囲内です。

たとえば、次のアニメーション画像は、CodeGeeX2 が Kotlin コードを生成するシーンを示しています。

写真

コードの生成速度は、人間が命令を入力する速度とほぼ同じです。

このことから、CodeGeeX2 では 1 回のクリックでコメントを追加したりデバッグしたりできることがわかります。

アルゴリズムの設計だけでなく、ユーティリティの作成も簡単です。

vue.js コードを完成させて、効率的に Web ページを構築しましょう。

写真

これらのコード関連のタスクに加えて、CodeGeeX2 には他の多くのアプリケーション シナリオがあります。

たとえば、SQL データベースをクエリします。

質問と回答モードを開いて、クエリするコンテンツを自然言語で記述するだけで、CodeGeeX2 が自動的に SQL クエリ ステートメントを生成します。

写真

モデルがさらに強力になった後、料金は発生しますか?ご心配なく、CodeGeeX プラグインの新しいバージョンは、個人ユーザー向けに引き続き無料で提供されます

6B パラメータ CodeGeeX2 もオープンソース化されており、関連コードは GitHub リポジトリで閲覧できます。

GitHub Copilotのモデルも及ばない

OpenAI の HumanEval 評価標準は、生成されたコードのパフォーマンスを適切に評価できます。

名前の通り、モデルによって生成されたコードの品質は人間によって評価されます。

HumanEval の評価では、60 億のパラメータを持つ CodeGeeX2 のスコアが150 億のパラメータを持つ StarCoder モデルのスコアよりも高く、小さな努力で大きな成果が得られたと言えます。

GitHub Copilot で使用される Code-Cushman-001 モデルも CodeGeeX2 には匹敵しません。

ただし、CodeGeeX は結局のところ多言語モデルであるのに対し、HumanEval は Python のみをサポートしています。

そこで、CodeGeeXのパフォーマンスをより正確にテストするために、ZhipuチームはGo、C++、Java、JSの4つの言語のテストデータを追加して、HumanEval-Xデータセットを取得しました。

結果は、複数の言語に関して、CodeGeeX2 の新しいバージョンが Python と同様に機能することを示しています。

第一世代と比較して、 CodeGeeX2のPass@1インジケーターのさまざまな言語での平均パフォーマンスは107%向上しました

その中で、 Rust 言語のパフォーマンスは 321% と大幅に向上しました。C++ および JS 言語のパフォーマンスも 70% 以上向上しました。

コード変換の点でも、CodeGeeX2 は競合他社よりも優れています。

「広告を見るのではなく、結果を見てください。」CodeGeeX は優れたテスト結果だけでなく、ユーザーからの認知度も高くなっています。

「CodeGeeX はプログラミング効率を向上させますか?」という質問に対して、 83.4% のユーザーが肯定的な回答をしました

調査結果に加えて、ユーザーも「足で投票」している。

最初のバージョンがリリースされて以来、CodeGeeX は 120,000 回ダウンロードされ、平均して 1 日あたり約 1,000 万行のコードが生成されています。

これのコンセプトは何ですか?コードの行数だけ見ると、これは 1 週間未満で Windows XP のバージョンを作成するのと同等です。

ここまで述べてきましたが、CodeGeeX を体験するにはどうすればよいでしょうか?

クイック体験

最初の方法は、VScode および JetBrains シリーズ IDE のプラグイン リポジトリに含まれている IDE 内のプラグインです。

IDE でプラグインを使用するだけでなく、CodeGeeX を Transformer ですばやく呼び出すこともできます。

 from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("THUDM/codegeex2-6b", trust_remote_code=True) model = AutoModel.from_pretrained("THUDM/codegeex2-6b", trust_remote_code=True, device='cuda') model = model.eval() # remember adding a language tag for better performance prompt = "# language: python\n# write a bubble sort function\n" inputs = tokenizer.encode(prompt, return_tensors="pt").to(model.device) outputs = model.generate(inputs, max_length=256, top_k=1) response = tokenizer.decode(outputs[0]) >>> print(response) # language: python # write a bubble sort function

対応しているIDEも無く、Transformerも面倒そうだけど、試してみたい。どうすればいいでしょうか?

問題ありません。オンライン版のデモもここにあります。

ポータル: https://codegeex.cn/zh-CN/playground

今すぐ「シームレスな自然言語プログラミング」を体験してみましょう!

論文アドレス: https://arxiv.org/abs/2303.17568
Github プロジェクトページ: https://github.com/THUDM/CodeGeeX2
Hugging Face プロジェクトページ: https://huggingface.co/THUDM/codegeex2-6b

<<:  自動運転 AI に「プラグイン」を与えると、0.1M で動作状態を区別する能力が大幅に向上します (HKU および TCL より) | オープンソース

>>:  WebGPT について簡単に説明してください。学びましたか?

ブログ    

推薦する

2020年が到来。人工知能について知っておくべきこと

新年を迎え、皆様にお楽しみいただいている「まとめ記事」が今年も登場です! 2020年に人工知能が大き...

アンドリュー・ングのパレートの法則: データの 80% + モデルの 20% = より優れた機械学習

機械学習の進歩がモデルによってもたらされるのか、それともデータによってもたらされるのかは、今世紀の論...

ベクトル監視なしのベクトル画像生成アルゴリズムがCVPR 2021に選出

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能とモノのインターネットを組み合わせた5つの技術応用トレンド

今年末までに、世界中で接続されるデバイスの数は 500 億台に達すると予測されており、モノのインター...

Dry goods: アルゴリズムの学習に役立つオープンソース プロジェクト

[[321744]]今日、LeetCode の問題やさまざまなアルゴリズム ルーチンを分析できる優れ...

アルゴリズム・ステーブルコインの流行が再び到来。このトレンドをリードするのはどれでしょうか?

先週、私たちは、Float、Rai、Fei、Gyroscope などの人気のアルゴリズム ステーブル...

ホスピタリティ業界における職場の変革 - 人間と機械の関係

ホスピタリティ業界は、過去数十年にわたって多くの世界的な混乱を経験してきたサービスベースの業界です。...

...

AWSクラウド上で機械学習を輸出するための黄金のツールであるAmazon SageMakerが正式に中国に上陸

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

XiaoIce 技術担当副社長、周 立氏: AI 対話がメタバースの新たな未来を切り開く

ゲスト: 周 麗編集者: Qianshan人間とコンピュータの対話は長い間私たちの日常生活に組み込ま...

画像認識AIは敵対的な画像に遭遇すると「盲目」になり、精度が90%低下する

[[271243]]視覚に関して、AIと人間の間にはどれくらいのギャップがあるのでしょうか?カリフォ...

...

ロボットが人間のライフラインを守る、6つの大きなトレンドが無限の可能性を浮き彫りにする

最近、梅雨の到来により、わが国の多くの都市が洪水期に突入し、南部のほとんどの都市が激しい暴風雨、洪水...

学者がインテリジェンス、モデルとデータAI、デジタルトランスフォーメーションについて語る。このAIイベントには技術的な内容が含まれている。

2022年、学者たちは人工知能の将来の発展をどのように見ているのでしょうか?将来、AI はモデル駆...

InnoDB ストレージ エンジンの 3 つの行ロック アルゴリズムの図解と例の分析

[[415025]]この記事はWeChatの公開アカウント「Flying Veal」から転載したもの...