GitHub ホットリストのトップ: オープンソースの GPT-4 コード インタープリター、任意の Python ライブラリをインストールでき、ローカル ターミナルで実行可能

GitHub ホットリストのトップ: オープンソースの GPT-4 コード インタープリター、任意の Python ライブラリをインストールでき、ローカル ターミナルで実行可能

ChatGPT のコード インタープリターは、自分のコンピューター上で実行できます。

ちょうど今、ある素晴らしい人が GitHub でコード インタープリターのローカル バージョンをリリースし、すぐに 3,000 以上のスターを獲得して GitHub ホット リストのトップになりました。

GPT-4 が元々持っていたすべての機能を備えているだけでなく、さらに重要なのは、インターネットに接続できることです。

写真

ChatGPTの「切断」のニュースは騒動を引き起こし、数か月間閉鎖されました。

数か月間インターネットが使えなかったのですが、ついに解決策が見つかりました。

コードはローカルで実行されるため、インターネット アクセスの必要性以外にも、Web バージョンの多くの問題が解決されます。

  • 3時間で送信できるメッセージは50件のみです
  • サポートされる Python モジュールの数が限られている
  • ファイルサイズは100MBまでに制限されています。
  • セッションウィンドウを閉じると、以前に生成されたファイルは削除されます。

API がない場合は、オープンソースの Code LLaMa でモデルを置き換えることもできます。

このコードインタープリターのリリース後、ネットユーザーはすぐにウェブバージョンへの期待を表明しました。

写真

それでは、このネイティブ コード インタープリターがどのようなものか見てみましょう。

GPTを再接続する

GPT-4 APIが呼び出されているので、当然GPT-4でサポートされている機能はすべて使用でき、もちろん中国語もサポートされています。

GPT 自体の機能についてはここでは詳しく説明しません。

ただし、コード インタープリターによって、GPT の数学的レベルが数レベル向上したことは注目に値します。

そこで、ここでは難しい導出問題を使ってこれをテストします。問題は f(x)=√(x+√(x+√x)) です。

写真

うーん... この結果は少し抽象的ですが、プロンプトワードの問題であるはずです。これを修正してみましょう。

写真

すると、次のような結果が得られました。

写真

この式は標準的な回答とは少し異なっているように見えますが、形式の問題でしょうか?検証しました:

写真

結果は正解です!

さて、本題に入り、このコード インタープリターのネットワーク機能が単なる仕掛けであるかどうかを確認します。

たとえば、最新のニュースが何かを確認したいとします。

写真

プログラムはまず、必要なモジュールがインストールされているかどうかを確認します。インストールされていない場合は、自動的にインストールしてから、Web ページの取得を開始します。

ウェブページ全体を一度読んで、ローカルで実行していない場合、画面上でコードがスクロールするのを見るのは確かに少し怖いと言わざるを得ません...

写真

プログラムは、ネットユーザーの間でニュースタイトルがどのフィールドに保存されているかを分析し、それを抽出します。

写真

幸いなことに、いくつかのトラブルの後、最終的に希望どおりの結果が得られました。

写真

自動検索に加えて、分析する特定の Web ページを指定することもできます。

写真

もう一度クレイジーなロードを実行した後、コードインタープリタは自己紹介を正常に再現しました。

写真

それで、ChatGPT のオンライン バージョンが複製されたので、さらに高度な機能はありますか?

もちろん!たとえば、システム設定を調整したいのですが、その方法がわかりません。

Web バージョンを使用すると、おそらく長いテキスト指示リストが表示されますが、今ではコード インタープリターに渡すだけで済みます。

長くてわかりにくいチュートリアルを提供する代わりに、コードを自動的に実行し、1 つのステップで作業を完了します。

写真

GPT-4 にコードを生成させるだけでなく、コード リポジトリ内の一部のツールを GPT-4 経由で呼び出すこともできます。

たとえば、ビデオに字幕を追加する場合は、replicate で既製の音声認識モジュールを呼び出すことができます。

手元に既製の資料がないので、開発者が提供したデモを次に示します。

写真

コードはローカルで実行されるため、ビデオのサイズが制限を超えることを心配する必要はありません。

つまり、実行すると、ビデオの下に字幕が表示されます。

同様に、この機能を使用してドキュメントや画像を生成および変更したり、ControlNet を呼び出して静止画像からアニメーションを生成したりすることもできます...

理論的には、パフォーマンスが十分であれば、Python でできることはすべて実行できます。

では、このネイティブ コード インタープリターを体験するにはどうすればよいでしょうか?

インストール方法

作者はGitHubプロジェクトページにColabノートブックを投稿しており(記事末尾のリンクを参照)、条件を満たしたネットユーザーは直接アクセスして体験することができる。

ローカル インストールも非常に簡単で (Python がインストールされていると仮定)、「pip install open-interpreter」という 1 行のコードを実行するだけで完了します。

インストール後、ターミナルに「interpreter」と入力して直接起動できます。

写真

プログラムは GPT-4 API を入力するように要求します。3.5 しかない場合は、起動時に「interpreter —fast」を使用する必要があります。

3.5 にもない場合は、この手順で Enter キーを押すか、Code-LLaMA への切り替えを開始するときに「interpreter —local」と直接入力してください。

7B、13B、34Bの3つのバージョンがあります。サイズが小さいほど速度が速くなり、サイズが大きいほど結果の精度が高くなります。

Code-LLaMA がインストールされていない場合は、プログラムの指示に従って自動的にインストールします。

写真

また、デフォルトでは、実行前にコードが生成され、確認されます。毎回確認したくない場合は、起動時にコマンドの後に「スペース-y」を追加できます。

一般的なコマンドの紹介はこれで終わりです。より高度な方法を知りたい場合は、著者のColabノートを参照してください。

気に入ったら今すぐお試しください!

GitHub プロジェクト ページ: https://github.com/KillianLucas/open-interpreter

<<:  エラー率が44%減少しました!ニューヨーク大学の最新の「顔生成」は、年齢を自由に変えることが可能で、10代から高齢者まであらゆる人をカバーできる。

>>: 

ブログ    

推薦する

VR時代、eスポーツは新たな輝きを放つ

[51CTO.comからのオリジナル記事] 2015年以降、仮想現実(VR)業界は急速に発展しました...

企業や不動産管理会社が課す顔認識要件をどのように規制するか?あなたの権利を守るには?

[[429833]]ショッピングモールは顔認識カメラをオンにし、情報は「気付かれずに」収集されます...

人工知能時代の雇用問題と解決策

人工知能(AI)は現在、頻繁に使われる言葉であり、一般的には、もう一つの総合的な技術革命、つまり「第...

...

AIはサイバーセキュリティにおいて人間に取って代わるでしょうか?両者は対立していない

近年、サイバーセキュリティ業界では人工知能技術が話題になっています。セキュリティ オーケストレーショ...

...

MIT、筋肉信号を使ってドローンを制御するシステムを開発

MITの研究者たちは、人間とロボットのシームレスなコラボレーションに近づく可能性のある新しいシステム...

AIを使って人間の子どもを「飼い慣らす」: ハードコアな子育ての楽しさを発見した父親

技術オタクの父親たちは、Netflix のエピソードを数本静かに観るために何をするのでしょうか? [...

...

あなたは人工知能についてどれくらい知っていますか?普通の人として、私たちはもっと多くのことを知る能力を持っているのでしょうか?

それはとても神秘的で、本当にハイエンドで、急速に発展しています!それは私たちの周りにあり、あなたは気...

協働ロボットは従来のロボットとどう違うのでしょうか?

協働ロボットは従来のロボットとどう違うのでしょうか? [[418520]]本質的には、協働ロボットと...

...

...

出会い系アプリの女の子たちは実はStyleGANによって生成された偽の人物である

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...