GitHub ホットリストのトップ: オープンソースの GPT-4 コードインタープリター、任意の Python ライブラリをインストールでき、ローカルターミナルで実行可能

ChatGPT のコードインタープリターは、自分のコンピューター上で実行できます。

ちょうど今、ある素晴らしい人が GitHub でコードインタープリターのローカルバージョンをリリースし、すぐに 3,000 以上のスターを獲得して GitHub ホットリストのトップになりました。

GPT-4 が元々持っていたすべての機能を備えているだけでなく、さらに重要なのは、インターネットに接続できることです。

写真

ChatGPTの「切断」のニュースは騒動を引き起こし、数か月間閉鎖されました。

数か月間インターネットが使えなかったのですが、ついに解決策が見つかりました。

コードはローカルで実行されるため、インターネットアクセスの必要性以外にも、Web バージョンの多くの問題が解決されます。

3時間で送信できるメッセージは50件のみです
サポートされる Python モジュールの数が限られている
ファイルサイズは100MBまでに制限されています。
セッションウィンドウを閉じると、以前に生成されたファイルは削除されます。

API がない場合は、オープンソースの Code LLaMa でモデルを置き換えることもできます。

このコードインタープリターのリリース後、ネットユーザーはすぐにウェブバージョンへの期待を表明しました。

写真

それでは、このネイティブコードインタープリターがどのようなものか見てみましょう。

GPTを再接続する

GPT-4 APIが呼び出されているので、当然GPT-4でサポートされている機能はすべて使用でき、もちろん中国語もサポートされています。

GPT 自体の機能についてはここでは詳しく説明しません。

ただし、コードインタープリターによって、GPT の数学的レベルが数レベル向上したことは注目に値します。

そこで、ここでは難しい導出問題を使ってこれをテストします。問題は f(x)=√(x+√(x+√x)) です。

写真

うーん... この結果は少し抽象的ですが、プロンプトワードの問題であるはずです。これを修正してみましょう。

写真

すると、次のような結果が得られました。

写真

この式は標準的な回答とは少し異なっているように見えますが、形式の問題でしょうか?検証しました:

写真

結果は正解です！

さて、本題に入り、このコードインタープリターのネットワーク機能が単なる仕掛けであるかどうかを確認します。

たとえば、最新のニュースが何かを確認したいとします。

写真

プログラムはまず、必要なモジュールがインストールされているかどうかを確認します。インストールされていない場合は、自動的にインストールしてから、Web ページの取得を開始します。

ウェブページ全体を一度読んで、ローカルで実行していない場合、画面上でコードがスクロールするのを見るのは確かに少し怖いと言わざるを得ません...

写真

プログラムは、ネットユーザーの間でニュースタイトルがどのフィールドに保存されているかを分析し、それを抽出します。

写真

幸いなことに、いくつかのトラブルの後、最終的に希望どおりの結果が得られました。

写真

自動検索に加えて、分析する特定の Web ページを指定することもできます。

写真

もう一度クレイジーなロードを実行した後、コードインタープリタは自己紹介を正常に再現しました。

写真

それで、ChatGPT のオンラインバージョンが複製されたので、さらに高度な機能はありますか?

もちろん！たとえば、システム設定を調整したいのですが、その方法がわかりません。

Web バージョンを使用すると、おそらく長いテキスト指示リストが表示されますが、今ではコードインタープリターに渡すだけで済みます。

長くてわかりにくいチュートリアルを提供する代わりに、コードを自動的に実行し、1 つのステップで作業を完了します。

写真

GPT-4 にコードを生成させるだけでなく、コードリポジトリ内の一部のツールを GPT-4 経由で呼び出すこともできます。

たとえば、ビデオに字幕を追加する場合は、replicate で既製の音声認識モジュールを呼び出すことができます。

手元に既製の資料がないので、開発者が提供したデモを次に示します。

写真

コードはローカルで実行されるため、ビデオのサイズが制限を超えることを心配する必要はありません。

つまり、実行すると、ビデオの下に字幕が表示されます。

同様に、この機能を使用してドキュメントや画像を生成および変更したり、ControlNet を呼び出して静止画像からアニメーションを生成したりすることもできます...

理論的には、パフォーマンスが十分であれば、Python でできることはすべて実行できます。

では、このネイティブコードインタープリターを体験するにはどうすればよいでしょうか?

インストール方法

作者はGitHubプロジェクトページにColabノートブックを投稿しており（記事末尾のリンクを参照）、条件を満たしたネットユーザーは直接アクセスして体験することができる。

ローカルインストールも非常に簡単で (Python がインストールされていると仮定)、「pip install open-interpreter」という 1 行のコードを実行するだけで完了します。

インストール後、ターミナルに「interpreter」と入力して直接起動できます。

写真

プログラムは GPT-4 API を入力するように要求します。3.5 しかない場合は、起動時に「interpreter —fast」を使用する必要があります。

3.5 にもない場合は、この手順で Enter キーを押すか、Code-LLaMA への切り替えを開始するときに「interpreter —local」と直接入力してください。

7B、13B、34Bの3つのバージョンがあります。サイズが小さいほど速度が速くなり、サイズが大きいほど結果の精度が高くなります。

Code-LLaMA がインストールされていない場合は、プログラムの指示に従って自動的にインストールします。

写真

また、デフォルトでは、実行前にコードが生成され、確認されます。毎回確認したくない場合は、起動時にコマンドの後に「スペース-y」を追加できます。

一般的なコマンドの紹介はこれで終わりです。より高度な方法を知りたい場合は、著者のColabノートを参照してください。

気に入ったら今すぐお試しください！

GitHub プロジェクトページ: https://github.com/KillianLucas/open-interpreter

<<: エラー率が44%減少しました!ニューヨーク大学の最新の「顔生成」は、年齢を自由に変えることが可能で、10代から高齢者まであらゆる人をカバーできる。

>>:

ブログ

AI生成コンテンツの隠れた危険性：AIがAIを学習するだけでは、インターネットは意味のないコンテンツで満たされる

ブログ

年末には自動運転が実りある成果を上げ、その後の開発はワンストップサービスとなるでしょう！

ブログ

モジュール式の機械学習システムで十分でしょうか?ベンジオの教師と生徒が答えを教えてくれます

ブログ

早期がん検査、医療AI：2020年の医療の10の進歩は注目に値する

ブログ

冬季オリンピックで使用されたロボット配送車両を振り返ると、自律走行機能が核となる

ブログ

これが顔認識と画像認識がますます重要になっている理由です

ブログ

GitHub ホットリストのトップ: オープンソースの GPT-4 コードインタープリター、任意の Python ライブラリをインストールでき、ローカルターミナルで実行可能

GPTを再接続する

インストール方法

AI生成コンテンツの隠れた危険性：AIがAIを学習するだけでは、インターネットは意味のないコンテンツで満たされる

年末には自動運転が実りある成果を上げ、その後の開発はワンストップサービスとなるでしょう！

モジュール式の機械学習システムで十分でしょうか?ベンジオの教師と生徒が答えを教えてくれます

早期がん検査、医療AI：2020年の医療の10の進歩は注目に値する

冬季オリンピックで使用されたロボット配送車両を振り返ると、自律走行機能が核となる

これが顔認識と画像認識がますます重要になっている理由です

推薦する

自動運転は飛躍的な進歩を遂げており、マスク氏は年内にL5レベルの自動運転が実現すると発言した。

老子のアルゴリズム思想の分析

DeepMind の巨額損失の背後で、今日の AI は正しい方向を選んだのでしょうか?

文脈学習 = 対照学習?人民大学が ICL 推論の背後にある暗黙の更新メカニズムを明らかに: 勾配は更新されるのか? 「さらに」

Zooxロボットタクシーが半プライベートルートでテストを開始

オープンコードについてはどうでしょうか?大規模言語モデルの民主化は、コストの高さとリソースの集中により、ますます困難になっています。

テンセントクラウドがAIペイント製品をリリース、25以上の生成スタイルをサポート

思考連鎖CoTは思考マップGoTへと進化し、思考ツリーよりも優れたヒントエンジニアリング技術が誕生した

AI不正対策！ディープフェイク音声・動画検出技術がCESでデビュー、精度は90%以上

ワールドカップはスコア予測にAIを使用。今回はスイスの銀行を信頼できるか？

SQL クエリエンジンの自然言語として GPT を使用する方法

数千億ドル規模の市場：教育用ロボットは本当に実現可能か？