この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。 マイクロソフトがまだ開発していないオペレーティングシステムレベルのChatGPTは、オープンソースプロジェクトによって実装されています—— Windows、Mac、Linux の 3 つの主要システムをサポートしており、コンピューターと直接通信するのと同じです。 指定されたフォルダーでターミナルを開くと、すべての Word ファイルが数秒で PDF に変換されます。 個々のファイルを操作するには、ファイルをドラッグ アンド ドロップするだけです。 アプリケーションの操作も簡単です。たった一文で、システムカレンダーを読み、スケジュールを整理し、指定されたメールアドレスに送信できます。 存在しないポモドーロ アプリをゼロから作成し、作成後すぐに使用することもできます。 この成果物はオープンソースのコードインタープリタOpen Interpreterです。リリースされるとすぐに GitHub のホットリストのトップになり、これまでに 18,000 個のスターを獲得しています。 デスクトップ版では事前キューイングを有効にしたので、端末操作に慣れていない友人でもグラフィカルインターフェースで簡単に使用できるようになりました。 (筆者によると500人以上が並んで待っているとのことなので、興味のある方は急いでください) オープンソースの GPT-4 コードインタープリター著者のKillian Lucas は当初、GPT-4 API を使用してオープンソースのミニマリスト コード インタープリターを作成するつもりでした。 ローカルで実行することで、次のような OpenAI 公式バージョンの多くの不便さを回避できます。
上記の制限はすべて Open Interpreter には存在しません。たった 1 つの API キーで、GPT-4 のパワーとローカル開発環境の柔軟性を組み合わせることができます。 GPU があれば、Code-Llama などの大規模なオープンソース モデルをローカルで実行できます。 著者は最近、インターネットが切断されている場合でも Falcon-180B を使用してデータをインタラクティブに視覚化する方法を示しました。 Killian 氏の Open Interpreter に対するビジョンは、 「誰もがプログラミングできるようにする」ことと、プログラミング言語を書く代わりに自然言語を使用することです。 試してみたい場合は、Python がインストールされていれば、 「pip install open-interpreter」と入力するだけで開始できます。 もちろん、実際の状況では、複雑なパッケージ依存関係の問題を回避するために、仮想環境にインストールすることをお勧めします。 初めて実行する場合は、OpenAI API キーを入力するよう求められます。 または、Enter キーを押して、7B、13B、34B の 3 つのバージョンがある無料の Code-Llama を選択します (Hugging Face から自動的にダウンロードされます)。 すると、乱雑なデスクトップを整理するなど、すぐに使い始めることができます。 安全上の理由から、コードを実行する前に y を入力して同意する必要があります。同意する前に確認することができます。 AI が作業を実行できることに本当に自信がある場合は、起動時に-y パラメータを追加することもできます。これにより、後続のすべてのコードがデフォルトで直接実行されます。 ただし、削除やその他の操作に関しては注意が必要です。ディレクトリ内のすべての json ファイルを削除しようとして、コンピューター上のすべての json ファイルを削除してしまった人もいます。 --fast はgpt-turbo-3.5 を使用することを意味します。それ以外の場合は、デフォルトで GPT-4 が使用されます。 GPT-4は強力ですが、APIの価格はまだ非常に高く、一部のネットユーザーは誤って20ドル以上を費やした経験を共有しました。 それに比べて、gpt-turbo-3.5 ははるかに安価です。半日繰り返しテストしてみましたが、コストはたったの8 セントでした。 そういえば、先ほどの仮想環境の設定方法を覚えていますか? 覚えていなくても問題ありません。二度と覚える必要はありません。Open Intepreter にセットアップを任せてください。 著者: ターゲットの新しいオペレーティング システム7 月中旬にプロジェクトが開始されて以来、Open Interpreter は頻繁に更新され、より多くのゲームプレイが開発されてきました。 たとえば、MacOS では、AppleScript を使用してシステム設定を制御し、1 つの文でシステムをダーク モードに変更できます。 ネットユーザーの中には、モバイル ブラウザから Colab を開き、偽装してiPhone 上で実行する方法さえ開発している人もいます。 このような素晴らしいオープンソース プロジェクトを作成した著者のキリアン氏は、名門大学の博士号を取得しているわけでも、大企業のエンジニアでもありません。西ワシントン大学で科学教育を専攻し、教育学士号を取得しました。 彼は現在、このプロジェクトで「自営業」をしており、AI エージェントに取り組む個人会社も経営しています。 キリアン氏は大きな野心を持っていることが分かります。その後に立ち上げられたウェブサイトはすべて、OpenAI の公式サイトのスタイルで設計されました。 現在、Open Interpreter はデスクトップ版のリリースも計画しており、電子メール アドレスを入力してキューに参加できるようになります。 一部のネットユーザーは、このプロジェクトがSF映画『her』に登場するAIコンパニオンのサマンサを思い出させると述べた。 Killian の返答からは、Open Interpreter を完全なオペレーティング システムに開発するという彼のより大きな目標もわかります。
GitHub: https://github.com/KillianLucas/open-interpreter デスクトップ版キュー: https://openinterpreter.com |
<<: GPT-4は「逆転の呪い」から逃れられない!新しい研究で判明:大規模モデルには推論上の欠陥がある:「AはB」とわかっていても、「BはA」とは限らない
>>: Appleが大規模モデル圧縮技術を革新、大規模モデルを携帯電話に搭載可能に
Google が発表した新しい研究論文では、音声検索や YouTube 動画へのテキスト説明やタグ...
最近、ケータリングボスインサイダーが主催する「Upward 2021・第6回中国ケータリングイノベー...
スマート シティは、接続性とデジタル イノベーションの未来として注目されています。 英国だけでも、全...
インテリジェントな都市変革の活発なトレンドの中で、AI を使用して交通渋滞を管理することは、誰もが多...
歴史は、人々に気づかれずに何度も同じ冗談を繰り返す、昔のいたずらっ子のようなものです。歴史は単なるジ...
人類の歴史において、あらゆる主要な技術革命は人類自身と社会全体に影響を及ぼしてきました。同じことは、...
AIアルゴリズムの偏り(性別、人種など)は海外ではもはや新しい話題ではありません。少し前には、イン...
触覚は人間が相互作用を調整する主な方法の 1 つです。触覚を通じて知覚される触覚は、人間が物体の大き...
社会が急速に変化する時代において、ブランドセーフティ戦略は分裂を招き、保護対象であるブランド評判その...
8月10日、国家知識産権局商標局の公式サイトによると、OPENAI OPCO, LLCは先月末に2...
Google Gemini のバグ修正はネットユーザーの目を開かせた! X という人物は、Gemin...
クラウド コンピューティングによってデータ センターが消滅し、AI プロジェクトは失敗する運命にある...
マイクロソフトは現在、チャットボットを開発中との報道もある。将来的に実用化に成功すれば、デジタル技術...