清華大学の「自然言語プログラミング成果物」が利用可能になりました! 100以上のプログラミング言語をサポートし、効率性が向上しました

清華大学の「自然言語プログラミング成果物」が利用可能になりました! 100以上のプログラミング言語をサポートし、効率性が向上しました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

清華大学とZhipu AIが共同開発した多言語コード生成モデル「CodeGeeX」がアップデートされました!

サポートするプログラミング言語の数は20から100以上に増加しました

IDE のプラグインを通じて、「シームレスな自然言語プログラミング」を簡単に実現できます。

写真

CodeGeeX2 は、基本モデルの新しいバージョンを使用しているため、さらに強力です。

この新しいバージョンの精度と速度はそれぞれ元のバージョンの 2 倍と 3 倍になっていますが、メモリ消費量は 1/5 しかありません。

コード生成、解釈、翻訳、エラー修正、プログラミングQ&Aなどの作業の効率が以前に比べて大幅に向上しました。

私たちは「クラス代表」として、CodeGeeX のアップデートを次の側面にまとめました。

  • コーディングスキルの向上
  • モデル特性が最適化されました
  • AIプログラミングアシスタントはより包括的な機能を備えています
  • ユーザー契約はよりオープンに

プラグインのバージョンも完全に更新されます

モデルは使用するには複雑すぎますか?問題ありません。モデル自体のアップデートに加えて、CodeGeeX のプラグイン バージョンもまもなく新しいバージョンに完全にアップグレードされます。

新しいプラグインは 100 を超えるプログラミング言語もサポートしており、おそらく私たちが知っているよりも多くなっています。

これらには、Python や Java などの私たちがよく知っている言語に加えて、Swift や Kotlin などの新興のモバイル フォースも含まれます。

Rust のようなシステムレベルのプログラミング言語も CodeGeeX2 の機能の範囲内です。

たとえば、次のアニメーション画像は、CodeGeeX2 が Kotlin コードを生成するシーンを示しています。

写真

コードの生成速度は、人間が命令を入力する速度とほぼ同じです。

このことから、CodeGeeX2 では 1 回のクリックでコメントを追加したりデバッグしたりできることがわかります。

アルゴリズムの設計だけでなく、ユーティリティの作成も簡単です。

vue.js コードを完成させて、効率的に Web ページを構築しましょう。

写真

これらのコード関連のタスクに加えて、CodeGeeX2 には他の多くのアプリケーション シナリオがあります。

たとえば、SQL データベースをクエリします。

質問と回答モードを開いて、クエリするコンテンツを自然言語で記述するだけで、CodeGeeX2 が自動的に SQL クエリ ステートメントを生成します。

写真

モデルがさらに強力になった後、料金は発生しますか?ご心配なく、CodeGeeX プラグインの新しいバージョンは、個人ユーザー向けに引き続き無料で提供されます

6B パラメータ CodeGeeX2 もオープンソース化されており、関連コードは GitHub リポジトリで閲覧できます。

GitHub Copilotのモデルも及ばない

OpenAI の HumanEval 評価標準は、生成されたコードのパフォーマンスを適切に評価できます。

名前の通り、モデルによって生成されたコードの品質は人間によって評価されます。

HumanEval の評価では、60 億のパラメータを持つ CodeGeeX2 のスコアが150 億のパラメータを持つ StarCoder モデルのスコアよりも高く、小さな努力で大きな成果が得られたと言えます。

GitHub Copilot で使用される Code-Cushman-001 モデルも CodeGeeX2 には匹敵しません。

ただし、CodeGeeX は結局のところ多言語モデルであるのに対し、HumanEval は Python のみをサポートしています。

そこで、CodeGeeXのパフォーマンスをより正確にテストするために、ZhipuチームはGo、C++、Java、JSの4つの言語のテストデータを追加して、HumanEval-Xデータセットを取得しました。

結果は、複数の言語に関して、CodeGeeX2 の新しいバージョンが Python と同様に機能することを示しています。

第一世代と比較して、 CodeGeeX2のPass@1インジケーターのさまざまな言語での平均パフォーマンスは107%向上しました

その中で、 Rust 言語のパフォーマンスは 321% と大幅に向上しました。C++ および JS 言語のパフォーマンスも 70% 以上向上しました。

コード変換の点でも、CodeGeeX2 は競合他社よりも優れています。

「広告を見るのではなく、結果を見てください。」CodeGeeX は優れたテスト結果だけでなく、ユーザーからの認知度も高くなっています。

「CodeGeeX はプログラミング効率を向上させますか?」という質問に対して、 83.4% のユーザーが肯定的な回答をしました

調査結果に加えて、ユーザーも「足で投票」している。

最初のバージョンがリリースされて以来、CodeGeeX は 120,000 回ダウンロードされ、平均して 1 日あたり約 1,000 万行のコードが生成されています。

これのコンセプトは何ですか?コードの行数だけ見ると、これは 1 週間未満で Windows XP のバージョンを作成するのと同等です。

ここまで述べてきましたが、CodeGeeX を体験するにはどうすればよいでしょうか?

クイック体験

最初の方法は、VScode および JetBrains シリーズ IDE のプラグイン リポジトリに含まれている IDE 内のプラグインです。

IDE でプラグインを使用するだけでなく、CodeGeeX を Transformer ですばやく呼び出すこともできます。

 from transformers import AutoTokenizer, AutoModel tokenizer = AutoTokenizer.from_pretrained("THUDM/codegeex2-6b", trust_remote_code=True) model = AutoModel.from_pretrained("THUDM/codegeex2-6b", trust_remote_code=True, device='cuda') model = model.eval() # remember adding a language tag for better performance prompt = "# language: python\n# write a bubble sort function\n" inputs = tokenizer.encode(prompt, return_tensors="pt").to(model.device) outputs = model.generate(inputs, max_length=256, top_k=1) response = tokenizer.decode(outputs[0]) >>> print(response) # language: python # write a bubble sort function

対応しているIDEも無く、Transformerも面倒そうだけど、試してみたい。どうすればいいでしょうか?

問題ありません。オンライン版のデモもここにあります。

ポータル: https://codegeex.cn/zh-CN/playground

今すぐ「シームレスな自然言語プログラミング」を体験してみましょう!

論文アドレス: https://arxiv.org/abs/2303.17568
Github プロジェクトページ: https://github.com/THUDM/CodeGeeX2
Hugging Face プロジェクトページ: https://huggingface.co/THUDM/codegeex2-6b

<<:  自動運転 AI に「プラグイン」を与えると、0.1M で動作状態を区別する能力が大幅に向上します (HKU および TCL より) | オープンソース

>>:  WebGPT について簡単に説明してください。学びましたか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ディープラーニングのこれらの落とし穴に遭遇したことがありますか?ニューラルネットワークのよくある落とし穴11選とその対処法

ニューラルネットワークがうまく動作しない場合はどうすればいいでしょうか?この記事の著者は、データの前...

...

ヘルスケア分野で人工知能がどのように台頭しているか

人工知能は世界のほぼすべての分野に変革をもたらしたようです。ヘルスケア業界は長年にわたって大きく変化...

マスク氏:AIの開発を止める人はいない。この呼びかけは、みんなに注意を払うよう思い出させるだけだ

6月18日のニュース: 今年3月、イーロン・マスク氏は人工知能技術の開発一時停止を呼びかけ、テクノロ...

Text2Image: NLP への新しいアプローチ

コンピュータービジョンと比較すると、自然言語処理 (NLP) は長い間解決が難しい問題であると考えら...

自動運転車のソフトウェアアップグレードに関する技術管理と規制戦略の分析

スマート車両ネットワーキング、インテリジェンス、アーキテクチャ技術の発展に伴い、自動車ではファームウ...

張漢松: 大ヒットARゲームのルールを解説

[[324671]] 【51CTO.comオリジナル記事】数日前、グローバル モバイル インターネ...

量子畳み込みネットワークにおける「不毛のプラトー」現象が解決され、新たな研究により量子AIの大きな問題が克服された

量子コンピュータの出現は、コンピュータ分野に多くの進歩をもたらしました。量子コンピュータ上で実行され...

...

2023 年のネットワーク パーティション: AI と自動化が状況をどのように変えるか

ネットワーク セグメンテーションは、企業の攻撃対象領域を減らし、横方向の移動を防ぐ基本的な予防的セキ...

...

学覇君主任科学者陳瑞峰:テクノロジーを活用して知識のサイロ化を減らし、教育の効率化を実現する

[51CTO.comからのオリジナル記事] 学習圧力が高く、教育資源の配分が不均衡な中国の教育システ...

今後10年間の主要な投資の方向性を予測して、あなたは未来に向けて準備ができていますか?

古代から今日のモバイルインターネット時代に至るまで、人類の誕生以来、世界に影響を与えてきたあらゆる破...

ロボティックプロセスオートメーション技術の新たな展開

急成長するデジタル経済は、新たな世界的な科学技術の進歩の産物であり、新興のデジタル技術とインテリジェ...

生成AIを使用して学生のイノベーションを促進する

今年も新学期がやってきましたが、教育者は AI テクノロジーの爆発的な進歩によって大きな倫理的プレッ...