この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 マイクロソフトがまだ開発していないオペレーティングシステムレベルのChatGPTは、オープンソースプロジェクトによって実装されています—— Windows、Mac、Linux の 3 つの主要システムをサポートしており、コンピューターと直接通信するのと同じです。 指定されたフォルダーでターミナルを開くと、すべての Word ファイルが数秒で PDF に変換されます。 個々のファイルを操作するには、ファイルをドラッグ アンド ドロップするだけです。 アプリケーションの操作も簡単です。たった一文で、システムカレンダーを読み、スケジュールを整理し、指定されたメールアドレスに送信できます。 存在しないポモドーロ アプリをゼロから作成し、作成後すぐに使用することもできます。 この成果物はオープンソースのコードインタープリタOpen Interpreterです。リリースされるとすぐに GitHub のホットリストのトップになり、これまでに 18,000 個のスターを獲得しています。 デスクトップ版では事前キューイングを有効にしたので、端末操作に慣れていない友人でもグラフィカルインターフェースで簡単に使用できるようになりました。 (筆者によると500人以上が並んで待っているとのことなので、興味のある方は急いでください) オープンソースの GPT-4 コードインタープリター著者のKillian Lucas は当初、GPT-4 API を使用してオープンソースのミニマリスト コード インタープリターを作成するつもりでした。 ローカルで実行することで、次のような OpenAI 公式バージョンの多くの不便さを回避できます。
上記の制限はすべて Open Interpreter には存在しません。たった 1 つの API キーで、GPT-4 のパワーとローカル開発環境の柔軟性を組み合わせることができます。 GPU があれば、Code-Llama などの大規模なオープンソース モデルをローカルで実行できます。 著者は最近、インターネットが切断されている場合でも Falcon-180B を使用してデータをインタラクティブに視覚化する方法を示しました。 Killian 氏の Open Interpreter に対するビジョンは、 「誰もがプログラミングできるようにする」ことと、プログラミング言語を書く代わりに自然言語を使用することです。 試してみたい場合は、Python がインストールされていれば、 「pip install open-interpreter」と入力するだけで開始できます。 もちろん、実際の状況では、複雑なパッケージ依存関係の問題を回避するために、仮想環境にインストールすることをお勧めします。 初めて実行する場合は、OpenAI API キーを入力するよう求められます。 または、Enter キーを押して、7B、13B、34B の 3 つのバージョンがある無料の Code-Llama を選択します (Hugging Face から自動的にダウンロードされます)。 すると、乱雑なデスクトップを整理するなど、すぐに使い始めることができます。 安全上の理由から、コードを実行する前に y を入力して同意する必要があります。同意する前に確認することができます。 AI が作業を実行できることに本当に自信がある場合は、起動時に-y パラメータを追加することもできます。これにより、後続のすべてのコードがデフォルトで直接実行されます。 ただし、削除やその他の操作に関しては注意が必要です。ディレクトリ内のすべての json ファイルを削除しようとして、コンピューター上のすべての json ファイルを削除してしまった人もいます。 --fast はgpt-turbo-3.5 を使用することを意味します。それ以外の場合は、デフォルトで GPT-4 が使用されます。 GPT-4は強力ですが、APIの価格はまだ非常に高く、一部のネットユーザーは誤って20ドル以上を費やした経験を共有しました。 それに比べて、gpt-turbo-3.5 ははるかに安価です。半日繰り返しテストしてみましたが、コストはたったの8 セントでした。 そういえば、先ほどの仮想環境の設定方法を覚えていますか? 覚えていなくても問題ありません。二度と覚える必要はありません。Open Intepreter にセットアップを任せてください。 著者: ターゲットの新しいオペレーティング システム7 月中旬にプロジェクトが開始されて以来、Open Interpreter は頻繁に更新され、より多くのゲームプレイが開発されてきました。 たとえば、MacOS では、AppleScript を使用してシステム設定を制御し、1 つの文でシステムをダーク モードに変更できます。 ネットユーザーの中には、モバイル ブラウザから Colab を開き、偽装してiPhone 上で実行する方法さえ開発している人もいます。 このような素晴らしいオープンソース プロジェクトを作成した著者のキリアン氏は、名門大学の博士号を取得しているわけでも、大企業のエンジニアでもありません。西ワシントン大学で科学教育を専攻し、教育学士号を取得しました。 彼は現在、このプロジェクトで「自営業」をしており、AI エージェントに取り組む個人会社も経営しています。 キリアン氏は大きな野心を持っていることが分かります。その後に立ち上げられたウェブサイトはすべて、OpenAI の公式サイトのスタイルで設計されました。 現在、Open Interpreter はデスクトップ版のリリースも計画しており、電子メール アドレスを入力してキューに参加できるようになります。 一部のネットユーザーは、このプロジェクトがSF映画『her』に登場するAIコンパニオンのサマンサを思い出させると述べた。 Killian の返答からは、Open Interpreter を完全なオペレーティング システムに開発するという彼のより大きな目標もわかります。
GitHub: https://github.com/KillianLucas/open-interpreter デスクトップ版キュー: https://openinterpreter.com |
<<: GPT-4は「逆転の呪い」から逃れられない!新しい研究で判明:大規模モデルには推論上の欠陥がある:「AはB」とわかっていても、「BはA」とは限らない
>>: Appleが大規模モデル圧縮技術を革新、大規模モデルを携帯電話に搭載可能に
人工知能といえば、最先端のクールなアプリケーションのほかに、この話題になると「偽物」という言葉が思い...
[[266600]] 2019年5月24日から25日まで、Yixue Education-Squi...
アマゾンは12月1日、昨日のre:Inventカンファレンスで、アマゾン初の画像生成モデル「Tita...
ペンシルベニア大学医学部が最近実施した研究では、人工知能がオピオイド乱用と戦うためにどのように使用で...
次のような状況に遭遇したことがあるかもしれません:携帯電話でアプリを開くと、最初に表示されるのは数分...
地球上の仕事でロボットが人間に取って代わり、今ではロボットが宇宙に行って仕事をこなすようになっている...
背景メディア伝送における一般的な帯域幅推定アルゴリズムには、GCC/BBR/PCC/QUBIC など...
中学校では、数学の描画ほど恐ろしいものはありませんでした。多くの問題にはすぐに利用できる解析的解法が...
海外メディアの報道によると、デザインソフトウェアプロバイダーのAdobeは最近、インドの生成AIスタ...
[[427578]]動物の知能は、環境と相互作用するにつれて、その体の形に合わせて進化します。例え...
小売業界の新小売への変革は、業界ではすでに認識されているトレンドであり、真に実装されたインテリジェン...