この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 マイクロソフトがまだ開発していないオペレーティングシステムレベルのChatGPTは、オープンソースプロジェクトによって実装されています—— Windows、Mac、Linux の 3 つの主要システムをサポートしており、コンピューターと直接通信するのと同じです。 指定されたフォルダーでターミナルを開くと、すべての Word ファイルが数秒で PDF に変換されます。 個々のファイルを操作するには、ファイルをドラッグ アンド ドロップするだけです。 アプリケーションの操作も簡単です。たった一文で、システムカレンダーを読み、スケジュールを整理し、指定されたメールアドレスに送信できます。 存在しないポモドーロ アプリをゼロから作成し、作成後すぐに使用することもできます。 この成果物はオープンソースのコードインタープリタOpen Interpreterです。リリースされるとすぐに GitHub のホットリストのトップになり、これまでに 18,000 個のスターを獲得しています。 デスクトップ版では事前キューイングを有効にしたので、端末操作に慣れていない友人でもグラフィカルインターフェースで簡単に使用できるようになりました。 (筆者によると500人以上が並んで待っているとのことなので、興味のある方は急いでください) オープンソースの GPT-4 コードインタープリター著者のKillian Lucas は当初、GPT-4 API を使用してオープンソースのミニマリスト コード インタープリターを作成するつもりでした。 ローカルで実行することで、次のような OpenAI 公式バージョンの多くの不便さを回避できます。
上記の制限はすべて Open Interpreter には存在しません。たった 1 つの API キーで、GPT-4 のパワーとローカル開発環境の柔軟性を組み合わせることができます。 GPU があれば、Code-Llama などの大規模なオープンソース モデルをローカルで実行できます。 著者は最近、インターネットが切断されている場合でも Falcon-180B を使用してデータをインタラクティブに視覚化する方法を示しました。 Killian 氏の Open Interpreter に対するビジョンは、 「誰もがプログラミングできるようにする」ことと、プログラミング言語を書く代わりに自然言語を使用することです。 試してみたい場合は、Python がインストールされていれば、 「pip install open-interpreter」と入力するだけで開始できます。 もちろん、実際の状況では、複雑なパッケージ依存関係の問題を回避するために、仮想環境にインストールすることをお勧めします。 初めて実行する場合は、OpenAI API キーを入力するよう求められます。 または、Enter キーを押して、7B、13B、34B の 3 つのバージョンがある無料の Code-Llama を選択します (Hugging Face から自動的にダウンロードされます)。 すると、乱雑なデスクトップを整理するなど、すぐに使い始めることができます。 安全上の理由から、コードを実行する前に y を入力して同意する必要があります。同意する前に確認することができます。 AI が作業を実行できることに本当に自信がある場合は、起動時に-y パラメータを追加することもできます。これにより、後続のすべてのコードがデフォルトで直接実行されます。 ただし、削除やその他の操作に関しては注意が必要です。ディレクトリ内のすべての json ファイルを削除しようとして、コンピューター上のすべての json ファイルを削除してしまった人もいます。 --fast はgpt-turbo-3.5 を使用することを意味します。それ以外の場合は、デフォルトで GPT-4 が使用されます。 GPT-4は強力ですが、APIの価格はまだ非常に高く、一部のネットユーザーは誤って20ドル以上を費やした経験を共有しました。 それに比べて、gpt-turbo-3.5 ははるかに安価です。半日繰り返しテストしてみましたが、コストはたったの8 セントでした。 そういえば、先ほどの仮想環境の設定方法を覚えていますか? 覚えていなくても問題ありません。二度と覚える必要はありません。Open Intepreter にセットアップを任せてください。 著者: ターゲットの新しいオペレーティング システム7 月中旬にプロジェクトが開始されて以来、Open Interpreter は頻繁に更新され、より多くのゲームプレイが開発されてきました。 たとえば、MacOS では、AppleScript を使用してシステム設定を制御し、1 つの文でシステムをダーク モードに変更できます。 ネットユーザーの中には、モバイル ブラウザから Colab を開き、偽装してiPhone 上で実行する方法さえ開発している人もいます。 このような素晴らしいオープンソース プロジェクトを作成した著者のキリアン氏は、名門大学の博士号を取得しているわけでも、大企業のエンジニアでもありません。西ワシントン大学で科学教育を専攻し、教育学士号を取得しました。 彼は現在、このプロジェクトで「自営業」をしており、AI エージェントに取り組む個人会社も経営しています。 キリアン氏は大きな野心を持っていることが分かります。その後に立ち上げられたウェブサイトはすべて、OpenAI の公式サイトのスタイルで設計されました。 現在、Open Interpreter はデスクトップ版のリリースも計画しており、電子メール アドレスを入力してキューに参加できるようになります。 一部のネットユーザーは、このプロジェクトがSF映画『her』に登場するAIコンパニオンのサマンサを思い出させると述べた。 Killian の返答からは、Open Interpreter を完全なオペレーティング システムに開発するという彼のより大きな目標もわかります。
GitHub: https://github.com/KillianLucas/open-interpreter デスクトップ版キュー: https://openinterpreter.com |
<<: GPT-4は「逆転の呪い」から逃れられない!新しい研究で判明:大規模モデルには推論上の欠陥がある:「AはB」とわかっていても、「BはA」とは限らない
>>: Appleが大規模モデル圧縮技術を革新、大規模モデルを携帯電話に搭載可能に
最近、マウスの世界でも仮想現実の時代が到来しました。はい、すべての人間が VR ヘッドセットを持って...
最近では、AI テクノロジーがさまざまな業界に大きな影響を与えていることがニュースで頻繁に紹介されて...
[[427319]] 01 データデータは、携帯電話に残すデジタルフットプリントから健康記録、買い物...
[[431792]]自己教師学習はコンピューター ビジョンで広く使用されており、手動で注釈を付ける...
[[414082]]画像ソース: https://pixabay.com/images/id-592...
1. はじめに周知のとおり、ディープラーニングはコンピュータービジョン、自然言語処理、人工知能などの...
近年、マスク氏の脳コンピューターインターフェース研究会社ニューラリンクが注目を集めている。 2019...
2023 年には、マルチモーダル大規模モデルの飛躍的な発展が見られるでしょう。マルチモーダル大規模言...
コンピューティング能力は、デジタル技術の継続的な発展とデジタル経済時代の中核的な生産性にとって重要な...
米国第2位の信用組合であるPenFedは、人工知能を活用して顧客とのやり取りの方法を変えようとしてい...
Apple の誰かがラベル付きデータを収集するために数億ドルを費やしましたが、まだ良い結果は得られて...
ネイチャー誌の表紙には、工学上の大きな進歩、つまり生物の細胞コロニーを模倣するロボットの登場が発表さ...
新世代の JVM ガベージ コレクション アルゴリズムをご存知ですか? ここで皆さんにご紹介しましょ...
[[275255]]ディープラーニングは人工知能モデルの先駆けです。画像認識、音声認識、テキスト理解...
進化するヘルスケアとテクノロジーの世界では、「感情 AI」と呼ばれる画期的なイノベーションが変化の兆...