GitHub ホットリストのトップ: オープンソースの GPT-4 コード インタープリター、任意の Python ライブラリをインストールでき、ローカル ターミナルで実行可能

GitHub ホットリストのトップ: オープンソースの GPT-4 コード インタープリター、任意の Python ライブラリをインストールでき、ローカル ターミナルで実行可能

ChatGPT のコード インタープリターは、自分のコンピューター上で実行できます。

ちょうど今、ある素晴らしい人が GitHub でコード インタープリターのローカル バージョンをリリースし、すぐに 3,000 以上のスターを獲得して GitHub ホット リストのトップになりました。

GPT-4 が元々持っていたすべての機能を備えているだけでなく、さらに重要なのは、インターネットに接続できることです。

写真

ChatGPTの「切断」のニュースは騒動を引き起こし、数か月間閉鎖されました。

数か月間インターネットが使えなかったのですが、ついに解決策が見つかりました。

コードはローカルで実行されるため、インターネット アクセスの必要性以外にも、Web バージョンの多くの問題が解決されます。

  • 3時間で送信できるメッセージは50件のみです
  • サポートされる Python モジュールの数が限られている
  • ファイルサイズは100MBまでに制限されています。
  • セッションウィンドウを閉じると、以前に生成されたファイルは削除されます。

API がない場合は、オープンソースの Code LLaMa でモデルを置き換えることもできます。

このコードインタープリターのリリース後、ネットユーザーはすぐにウェブバージョンへの期待を表明しました。

写真

それでは、このネイティブ コード インタープリターがどのようなものか見てみましょう。

GPTを再接続する

GPT-4 APIが呼び出されているので、当然GPT-4でサポートされている機能はすべて使用でき、もちろん中国語もサポートされています。

GPT 自体の機能についてはここでは詳しく説明しません。

ただし、コード インタープリターによって、GPT の数学的レベルが数レベル向上したことは注目に値します。

そこで、ここでは難しい導出問題を使ってこれをテストします。問題は f(x)=√(x+√(x+√x)) です。

写真

うーん... この結果は少し抽象的ですが、プロンプトワードの問題であるはずです。これを修正してみましょう。

写真

すると、次のような結果が得られました。

写真

この式は標準的な回答とは少し異なっているように見えますが、形式の問題でしょうか?検証しました:

写真

結果は正解です!

さて、本題に入り、このコード インタープリターのネットワーク機能が単なる仕掛けであるかどうかを確認します。

たとえば、最新のニュースが何かを確認したいとします。

写真

プログラムはまず、必要なモジュールがインストールされているかどうかを確認します。インストールされていない場合は、自動的にインストールしてから、Web ページの取得を開始します。

ウェブページ全体を一度読んで、ローカルで実行していない場合、画面上でコードがスクロールするのを見るのは確かに少し怖いと言わざるを得ません...

写真

プログラムは、ネットユーザーの間でニュースタイトルがどのフィールドに保存されているかを分析し、それを抽出します。

写真

幸いなことに、いくつかのトラブルの後、最終的に希望どおりの結果が得られました。

写真

自動検索に加えて、分析する特定の Web ページを指定することもできます。

写真

もう一度クレイジーなロードを実行した後、コードインタープリタは自己紹介を正常に再現しました。

写真

それで、ChatGPT のオンライン バージョンが複製されたので、さらに高度な機能はありますか?

もちろん!たとえば、システム設定を調整したいのですが、その方法がわかりません。

Web バージョンを使用すると、おそらく長いテキスト指示リストが表示されますが、今ではコード インタープリターに渡すだけで済みます。

長くてわかりにくいチュートリアルを提供する代わりに、コードを自動的に実行し、1 つのステップで作業を完了します。

写真

GPT-4 にコードを生成させるだけでなく、コード リポジトリ内の一部のツールを GPT-4 経由で呼び出すこともできます。

たとえば、ビデオに字幕を追加する場合は、replicate で既製の音声認識モジュールを呼び出すことができます。

手元に既製の資料がないので、開発者が提供したデモを次に示します。

写真

コードはローカルで実行されるため、ビデオのサイズが制限を超えることを心配する必要はありません。

つまり、実行すると、ビデオの下に字幕が表示されます。

同様に、この機能を使用してドキュメントや画像を生成および変更したり、ControlNet を呼び出して静止画像からアニメーションを生成したりすることもできます...

理論的には、パフォーマンスが十分であれば、Python でできることはすべて実行できます。

では、このネイティブ コード インタープリターを体験するにはどうすればよいでしょうか?

インストール方法

作者はGitHubプロジェクトページにColabノートブックを投稿しており(記事末尾のリンクを参照)、条件を満たしたネットユーザーは直接アクセスして体験することができる。

ローカル インストールも非常に簡単で (Python がインストールされていると仮定)、「pip install open-interpreter」という 1 行のコードを実行するだけで完了します。

インストール後、ターミナルに「interpreter」と入力して直接起動できます。

写真

プログラムは GPT-4 API を入力するように要求します。3.5 しかない場合は、起動時に「interpreter —fast」を使用する必要があります。

3.5 にもない場合は、この手順で Enter キーを押すか、Code-LLaMA への切り替えを開始するときに「interpreter —local」と直接入力してください。

7B、13B、34Bの3つのバージョンがあります。サイズが小さいほど速度が速くなり、サイズが大きいほど結果の精度が高くなります。

Code-LLaMA がインストールされていない場合は、プログラムの指示に従って自動的にインストールします。

写真

また、デフォルトでは、実行前にコードが生成され、確認されます。毎回確認したくない場合は、起動時にコマンドの後に「スペース-y」を追加できます。

一般的なコマンドの紹介はこれで終わりです。より高度な方法を知りたい場合は、著者のColabノートを参照してください。

気に入ったら今すぐお試しください!

GitHub プロジェクト ページ: https://github.com/KillianLucas/open-interpreter

<<:  エラー率が44%減少しました!ニューヨーク大学の最新の「顔生成」は、年齢を自由に変えることが可能で、10代から高齢者まであらゆる人をカバーできる。

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

インテルと4Paradigmが協力し、誰もがAIを利用できるように

[51CTO.com からのオリジナル記事] 今日、人工知能はもはや遠い概念ではなく、私たちの仕事と...

...

...

AI とブロックチェーンは 2020 年にモバイル アプリ業界にどのような革命を起こすのでしょうか?

新たな10年を迎えるにあたり、人々は過去10年間の経験と教訓を活用する必要があります。モバイル アプ...

Metaが新しいモバイルAIジェネレーターを公開、5分でAIアプリを作成、AndroidとiOSの両方をサポート

最近、毎年恒例の PyTorch 開発者会議が開催されました。このカンファレンスでは、Meta(旧F...

...

人工知能デジタル技術の強化は現実予測において徐々にその力を発揮しつつある

現在、人工知能は人々の生活の中でますます普及しており、生活のあらゆるところで人工知能を見つけることが...

...

...

ビッグデータが急成長し、我が国のクラウドコンピューティングは「黄金の窓」の時代を迎えている

[[206431]]クラウドコンピューティングは、電力網、交通網、インターネットと同様の「国家インフ...

インテリジェントな変革の時代を迎える: AIでビジネスの未来をリードする

インテリジェント トランスフォーメーションの本質: インテリジェント トランスフォーメーションは、テ...

AIがデータセンター運営者が直面する課題をどう解決するか

業界の専門家が、業界内で発生する運用上の課題の解決に AI がどのように役立つか、データ センター業...

一度に35万字の漢字を読める世界最強の長文モデル「Baichuan2-192K」がオンラインに

国内の大型モデルスタートアップがテクノロジーの最前線で新記録を打ち立てている。 10月30日、百川知...

...