ChatGPT のコード インタープリターは、自分のコンピューター上で実行できます。 ちょうど今、ある素晴らしい人が GitHub でコード インタープリターのローカル バージョンをリリースし、すぐに 3,000 以上のスターを獲得して GitHub ホット リストのトップになりました。 GPT-4 が元々持っていたすべての機能を備えているだけでなく、さらに重要なのは、インターネットに接続できることです。 写真 ChatGPTの「切断」のニュースは騒動を引き起こし、数か月間閉鎖されました。 数か月間インターネットが使えなかったのですが、ついに解決策が見つかりました。 コードはローカルで実行されるため、インターネット アクセスの必要性以外にも、Web バージョンの多くの問題が解決されます。
API がない場合は、オープンソースの Code LLaMa でモデルを置き換えることもできます。 このコードインタープリターのリリース後、ネットユーザーはすぐにウェブバージョンへの期待を表明しました。 写真 それでは、このネイティブ コード インタープリターがどのようなものか見てみましょう。 GPTを再接続するGPT-4 APIが呼び出されているので、当然GPT-4でサポートされている機能はすべて使用でき、もちろん中国語もサポートされています。 GPT 自体の機能についてはここでは詳しく説明しません。 ただし、コード インタープリターによって、GPT の数学的レベルが数レベル向上したことは注目に値します。 そこで、ここでは難しい導出問題を使ってこれをテストします。問題は f(x)=√(x+√(x+√x)) です。 写真 うーん... この結果は少し抽象的ですが、プロンプトワードの問題であるはずです。これを修正してみましょう。 写真 すると、次のような結果が得られました。 写真 この式は標準的な回答とは少し異なっているように見えますが、形式の問題でしょうか?検証しました: 写真 結果は正解です! さて、本題に入り、このコード インタープリターのネットワーク機能が単なる仕掛けであるかどうかを確認します。 たとえば、最新のニュースが何かを確認したいとします。 写真 プログラムはまず、必要なモジュールがインストールされているかどうかを確認します。インストールされていない場合は、自動的にインストールしてから、Web ページの取得を開始します。 ウェブページ全体を一度読んで、ローカルで実行していない場合、画面上でコードがスクロールするのを見るのは確かに少し怖いと言わざるを得ません... 写真 プログラムは、ネットユーザーの間でニュースタイトルがどのフィールドに保存されているかを分析し、それを抽出します。 写真 幸いなことに、いくつかのトラブルの後、最終的に希望どおりの結果が得られました。 写真 自動検索に加えて、分析する特定の Web ページを指定することもできます。 写真 もう一度クレイジーなロードを実行した後、コードインタープリタは自己紹介を正常に再現しました。 写真 それで、ChatGPT のオンライン バージョンが複製されたので、さらに高度な機能はありますか? もちろん!たとえば、システム設定を調整したいのですが、その方法がわかりません。 Web バージョンを使用すると、おそらく長いテキスト指示リストが表示されますが、今ではコード インタープリターに渡すだけで済みます。 長くてわかりにくいチュートリアルを提供する代わりに、コードを自動的に実行し、1 つのステップで作業を完了します。 写真 GPT-4 にコードを生成させるだけでなく、コード リポジトリ内の一部のツールを GPT-4 経由で呼び出すこともできます。 たとえば、ビデオに字幕を追加する場合は、replicate で既製の音声認識モジュールを呼び出すことができます。 手元に既製の資料がないので、開発者が提供したデモを次に示します。 写真 コードはローカルで実行されるため、ビデオのサイズが制限を超えることを心配する必要はありません。 つまり、実行すると、ビデオの下に字幕が表示されます。 同様に、この機能を使用してドキュメントや画像を生成および変更したり、ControlNet を呼び出して静止画像からアニメーションを生成したりすることもできます... 理論的には、パフォーマンスが十分であれば、Python でできることはすべて実行できます。 では、このネイティブ コード インタープリターを体験するにはどうすればよいでしょうか? インストール方法作者はGitHubプロジェクトページにColabノートブックを投稿しており(記事末尾のリンクを参照)、条件を満たしたネットユーザーは直接アクセスして体験することができる。 ローカル インストールも非常に簡単で (Python がインストールされていると仮定)、「pip install open-interpreter」という 1 行のコードを実行するだけで完了します。 インストール後、ターミナルに「interpreter」と入力して直接起動できます。 写真 プログラムは GPT-4 API を入力するように要求します。3.5 しかない場合は、起動時に「interpreter —fast」を使用する必要があります。 3.5 にもない場合は、この手順で Enter キーを押すか、Code-LLaMA への切り替えを開始するときに「interpreter —local」と直接入力してください。 7B、13B、34Bの3つのバージョンがあります。サイズが小さいほど速度が速くなり、サイズが大きいほど結果の精度が高くなります。 Code-LLaMA がインストールされていない場合は、プログラムの指示に従って自動的にインストールします。 写真 また、デフォルトでは、実行前にコードが生成され、確認されます。毎回確認したくない場合は、起動時にコマンドの後に「スペース-y」を追加できます。 一般的なコマンドの紹介はこれで終わりです。より高度な方法を知りたい場合は、著者のColabノートを参照してください。 気に入ったら今すぐお試しください! GitHub プロジェクト ページ: https://github.com/KillianLucas/open-interpreter |
<<: エラー率が44%減少しました!ニューヨーク大学の最新の「顔生成」は、年齢を自由に変えることが可能で、10代から高齢者まであらゆる人をカバーできる。
[51CTO.com からのオリジナル記事] 今日、人工知能はもはや遠い概念ではなく、私たちの仕事と...
新たな10年を迎えるにあたり、人々は過去10年間の経験と教訓を活用する必要があります。モバイル アプ...
最近、毎年恒例の PyTorch 開発者会議が開催されました。このカンファレンスでは、Meta(旧F...
現在、人工知能は人々の生活の中でますます普及しており、生活のあらゆるところで人工知能を見つけることが...
[[206431]]クラウドコンピューティングは、電力網、交通網、インターネットと同様の「国家インフ...
インテリジェント トランスフォーメーションの本質: インテリジェント トランスフォーメーションは、テ...
業界の専門家が、業界内で発生する運用上の課題の解決に AI がどのように役立つか、データ センター業...
国内の大型モデルスタートアップがテクノロジーの最前線で新記録を打ち立てている。 10月30日、百川知...