GitHub ホットリストのトップ: オープンソースの GPT-4 コード インタープリター、任意の Python ライブラリをインストールでき、ローカル ターミナルで実行可能

GitHub ホットリストのトップ: オープンソースの GPT-4 コード インタープリター、任意の Python ライブラリをインストールでき、ローカル ターミナルで実行可能

ChatGPT のコード インタープリターは、自分のコンピューター上で実行できます。

ちょうど今、ある素晴らしい人が GitHub でコード インタープリターのローカル バージョンをリリースし、すぐに 3,000 以上のスターを獲得して GitHub ホット リストのトップになりました。

GPT-4 が元々持っていたすべての機能を備えているだけでなく、さらに重要なのは、インターネットに接続できることです。

写真

ChatGPTの「切断」のニュースは騒動を引き起こし、数か月間閉鎖されました。

数か月間インターネットが使えなかったのですが、ついに解決策が見つかりました。

コードはローカルで実行されるため、インターネット アクセスの必要性以外にも、Web バージョンの多くの問題が解決されます。

  • 3時間で送信できるメッセージは50件のみです
  • サポートされる Python モジュールの数が限られている
  • ファイルサイズは100MBまでに制限されています。
  • セッションウィンドウを閉じると、以前に生成されたファイルは削除されます。

API がない場合は、オープンソースの Code LLaMa でモデルを置き換えることもできます。

このコードインタープリターのリリース後、ネットユーザーはすぐにウェブバージョンへの期待を表明しました。

写真

それでは、このネイティブ コード インタープリターがどのようなものか見てみましょう。

GPTを再接続する

GPT-4 APIが呼び出されているので、当然GPT-4でサポートされている機能はすべて使用でき、もちろん中国語もサポートされています。

GPT 自体の機能についてはここでは詳しく説明しません。

ただし、コード インタープリターによって、GPT の数学的レベルが数レベル向上したことは注目に値します。

そこで、ここでは難しい導出問題を使ってこれをテストします。問題は f(x)=√(x+√(x+√x)) です。

写真

うーん... この結果は少し抽象的ですが、プロンプトワードの問題であるはずです。これを修正してみましょう。

写真

すると、次のような結果が得られました。

写真

この式は標準的な回答とは少し異なっているように見えますが、形式の問題でしょうか?検証しました:

写真

結果は正解です!

さて、本題に入り、このコード インタープリターのネットワーク機能が単なる仕掛けであるかどうかを確認します。

たとえば、最新のニュースが何かを確認したいとします。

写真

プログラムはまず、必要なモジュールがインストールされているかどうかを確認します。インストールされていない場合は、自動的にインストールしてから、Web ページの取得を開始します。

ウェブページ全体を一度読んで、ローカルで実行していない場合、画面上でコードがスクロールするのを見るのは確かに少し怖いと言わざるを得ません...

写真

プログラムは、ネットユーザーの間でニュースタイトルがどのフィールドに保存されているかを分析し、それを抽出します。

写真

幸いなことに、いくつかのトラブルの後、最終的に希望どおりの結果が得られました。

写真

自動検索に加えて、分析する特定の Web ページを指定することもできます。

写真

もう一度クレイジーなロードを実行した後、コードインタープリタは自己紹介を正常に再現しました。

写真

それで、ChatGPT のオンライン バージョンが複製されたので、さらに高度な機能はありますか?

もちろん!たとえば、システム設定を調整したいのですが、その方法がわかりません。

Web バージョンを使用すると、おそらく長いテキスト指示リストが表示されますが、今ではコード インタープリターに渡すだけで済みます。

長くてわかりにくいチュートリアルを提供する代わりに、コードを自動的に実行し、1 つのステップで作業を完了します。

写真

GPT-4 にコードを生成させるだけでなく、コード リポジトリ内の一部のツールを GPT-4 経由で呼び出すこともできます。

たとえば、ビデオに字幕を追加する場合は、replicate で既製の音声認識モジュールを呼び出すことができます。

手元に既製の資料がないので、開発者が提供したデモを次に示します。

写真

コードはローカルで実行されるため、ビデオのサイズが制限を超えることを心配する必要はありません。

つまり、実行すると、ビデオの下に字幕が表示されます。

同様に、この機能を使用してドキュメントや画像を生成および変更したり、ControlNet を呼び出して静止画像からアニメーションを生成したりすることもできます...

理論的には、パフォーマンスが十分であれば、Python でできることはすべて実行できます。

では、このネイティブ コード インタープリターを体験するにはどうすればよいでしょうか?

インストール方法

作者はGitHubプロジェクトページにColabノートブックを投稿しており(記事末尾のリンクを参照)、条件を満たしたネットユーザーは直接アクセスして体験することができる。

ローカル インストールも非常に簡単で (Python がインストールされていると仮定)、「pip install open-interpreter」という 1 行のコードを実行するだけで完了します。

インストール後、ターミナルに「interpreter」と入力して直接起動できます。

写真

プログラムは GPT-4 API を入力するように要求します。3.5 しかない場合は、起動時に「interpreter —fast」を使用する必要があります。

3.5 にもない場合は、この手順で Enter キーを押すか、Code-LLaMA への切り替えを開始するときに「interpreter —local」と直接入力してください。

7B、13B、34Bの3つのバージョンがあります。サイズが小さいほど速度が速くなり、サイズが大きいほど結果の精度が高くなります。

Code-LLaMA がインストールされていない場合は、プログラムの指示に従って自動的にインストールします。

写真

また、デフォルトでは、実行前にコードが生成され、確認されます。毎回確認したくない場合は、起動時にコマンドの後に「スペース-y」を追加できます。

一般的なコマンドの紹介はこれで終わりです。より高度な方法を知りたい場合は、著者のColabノートを参照してください。

気に入ったら今すぐお試しください!

GitHub プロジェクト ページ: https://github.com/KillianLucas/open-interpreter

<<:  エラー率が44%減少しました!ニューヨーク大学の最新の「顔生成」は、年齢を自由に変えることが可能で、10代から高齢者まであらゆる人をカバーできる。

>>: 

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

自動運転は飛躍的な進歩を遂げており、マスク氏は年内にL5レベルの自動運転が実現すると発言した。

自動運転技術は、世界中の大手自動車メーカーの主要な研究開発方向となっています。現在、多くの自動車メー...

老子のアルゴリズム思想の分析

前回の記事「屈原と漁師のアルゴリズムの追求」では、屈原が効率的なアルゴリズムを追求したのに対し、漁師...

...

...

DeepMind の巨額損失の背後で、今日の AI は正しい方向を選んだのでしょうか?

DeepMind は研究に重点を置く世界最大の AI 企業かもしれないが、過去 3 年間の損失は ...

文脈学習 = 対照学習?人民大学が ICL 推論の背後にある暗黙の更新メカニズムを明らかに: 勾配は更新されるのか? 「さらに」

近年、Transformer に基づく大規模言語モデルは、驚くべきコンテキスト内学習 (ICL) 機...

...

Zooxロボットタクシーが半プライベートルートでテストを開始

Zooxの共同創業者兼CTOのジェシー・レビンソン氏によると、同社は数十台のカスタム電動ロボットタク...

テンセントクラウドがAIペイント製品をリリース、25以上の生成スタイルをサポート

9月10日、テンセントクラウドは9月7日に開催された2023テンセントグローバルデジタルエコシステム...

思考連鎖CoTは思考マップGoTへと進化し、思考ツリーよりも優れたヒントエンジニアリング技術が誕生した

大規模言語モデル (LLM) の機能を最大限に活用するには、効果的なプロンプト設計ソリューションが不...

AI不正対策!ディープフェイク音声・動画検出技術がCESでデビュー、精度は90%以上

真実とは程遠いが、アメリカの消費者向けニュースおよびビジネスチャンネルCNBCのロゴ入りのビデオでは...

ワールドカップはスコア予測にAIを使用。今回はスイスの銀行を信頼できるか?

ワールドカップが本格的に開幕し、大手データおよび人工知能技術組織もワールドカップの予想に参加している...

SQL クエリ エンジンの自然言語として GPT を使用する方法

翻訳者 |李睿レビュー | Chonglou 今日では、 ChatGPTのような生成AI技術のおかげ...

数千億ドル規模の市場:教育用ロボットは本当に実現可能か?

[[341606]]ある調査では、2025年までに中国の教育用ロボット市場は3000億ドルに達し、...