オペレーティング システム レベルの ChatGPT は人気があります。これにより、コンピューターが独自のデスクトップを整理できます。Mac/Windows/Linux をサポートしています。

オペレーティング システム レベルの ChatGPT は人気があります。これにより、コンピューターが独自のデスクトップを整理できます。Mac/Windows/Linux をサポートしています。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

マイクロソフトがまだ開発していないオペレーティングシステムレベルのChatGPTは、オープンソースプロジェクトによって実装されています——

Windows、Mac、Linux の 3 つの主要システムをサポートしており、コンピューターと直接通信するのと同じです。

指定されたフォルダーでターミナルを開くと、すべての Word ファイルが数秒で​​ PDF に変換されます。

個々のファイルを操作するには、ファイルをドラッグ アンド ドロップするだけです。

アプリケーションの操作も簡単です。たった一文で、システムカレンダーを読み、スケジュールを整理し、指定されたメールアドレスに送信できます。

存在しないポモドーロ アプリをゼロから作成し、作成後すぐに使用することもできます。

この成果物はオープンソースのコードインタープリタOpen Interpreterです。リリースされるとすぐに GitHub のホットリストのトップになり、これまでに 18,000 個のスターを獲得しています。

デスクトップ版では事前キューイングを有効にしたので、端末操作に慣れていない友人でもグラフィカルインターフェースで簡単に使用できるようになりました。

(筆者によると500人以上が並んで待っているとのことなので、興味のある方は急いでください)

オープンソースの GPT-4 コードインタープリター

著者のKillian Lucas は当初、GPT-4 API を使用してオープンソースのミニマリスト コード インタープリターを作成するつもりでした。

ローカルで実行することで、次のような OpenAI 公式バージョンの多くの不便さを回避できます。

  • 3時間で送信できるメッセージは25/50件のみです
  • プリインストールされたPythonパッケージは制限されており、オンラインで新しいパッケージをインストールすることはできません。
  • アップロードできるファイルのサイズは100MBを超えず、再生時間は120秒に制限されています。
  • セッション環境は長期間保持できず、ファイルは消去されます

上記の制限はすべて Open Interpreter には存在しません。たった 1 つの API キーで、GPT-4 のパワーとローカル開発環境の柔軟性を組み合わせることができます。

GPU があれば、Code-Llama などの大規模なオープンソース モデルをローカルで実行できます。

著者は最近、インターネットが切断されている場合でも Falcon-180B を使用してデータをインタラクティブに視覚化する方法を示しました。

Killian 氏の Open Interpreter に対するビジョンは、 「誰もがプログラミングできるようにする」ことと、プログラミング言語を書く代わりに自然言語を使用することです。

試してみたい場合は、Python がインストールされていれば、 「pip install open-interpreter」と入力するだけで開始できます。

もちろん、実際の状況では、複雑なパッケージ依存関係の問題を回避するために、仮想環境にインストールすることをお勧めします。

初めて実行する場合は、OpenAI API キーを入力するよう求められます。

または、Enter キーを押して、7B、13B、34B の 3 つのバージョンがある無料の Code-Llama を選択します (Hugging Face から自動的にダウンロードされます)。

すると、乱雑なデスクトップを整理するなど、すぐに使い始めることができます。

安全上の理由から、コードを実行する前に y を入力して同意する必要があります。同意する前に確認することができます。

AI が作業を実行できることに本当に自信がある場合は、起動時に-y パラメータを追加することもできます。これにより、後続のすべてのコードがデフォルトで直接実行されます。

ただし、削除やその他の操作に関しては注意が必要です。ディレクトリ内のすべての json ファイルを削除しようとして、コンピューター上のすべての json ファイルを削除してしまった人もいます。

--fast はgpt-turbo-3.5 を使用することを意味します。それ以外の場合は、デフォルトで GPT-4 が使用されます。

GPT-4は強力ですが、APIの価格はまだ非常に高く、一部のネットユーザーは誤って20ドル以上を費やした経験を共有しました。

それに比べて、gpt-turbo-3.5 ははるかに安価です。半日繰り返しテストしてみましたが、コストはたったの8 セントでした。

そういえば、先ほどの仮想環境の設定方法を覚えていますか?

覚えていなくても問題ありません。二度と覚える必要はありません。Open Intepreter にセットアップを任せてください。

著者: ターゲットの新しいオペレーティング システム

7 月中旬にプロジェクトが開始されて以来、Open Interpreter は頻繁に更新され、より多くのゲームプレイが開発されてきました。

たとえば、MacOS では、AppleScript を使用してシステム設定を制御し、1 つの文でシステムをダーク モードに変更できます。

ネットユーザーの中には、モバイル ブラウザから Colab を開き、偽装してiPhone 上で実行する方法さえ開発している人もいます。

このような素晴らしいオープンソース プロジェクトを作成した著者のキリアン氏は、名門大学の博士号を取得しているわけでも、大企業のエンジニアでもありません。西ワシントン大学で科学教育を専攻し、教育学士号を取得しました。

彼は現在、このプロジェクトで「自営業」をしており、AI エージェントに取り組む個人会社も経営しています。

キリアン氏は大きな野心を持っていることが分かります。その後に立ち上げられたウェブサイトはすべて、OpenAI の公式サイトのスタイルで設計されました。

現在、Open Interpreter はデスクトップ版のリリースも計画しており、電子メール アドレスを入力してキューに参加できるようになります。

一部のネットユーザーは、このプロジェクトがSF映画『her』に登場するAIコンパニオンのサマンサを思い出させると述べた。

Killian の返答からは、Open Interpreter を完全なオペレーティング システムに開発するという彼のより大きな目標もわかります。

いつか『her』の監督、スパイク・ジョーンズが私のオペレーティング システムのコマーシャルを撮影してくれることを願っています。

GitHub: https://github.com/KillianLucas/open-interpreter

デスクトップ版キュー: https://openinterpreter.com


<<:  GPT-4は「逆転の呪い」から逃れられない!新しい研究で判明:大規模モデルには推論上の欠陥がある:「AはB」とわかっていても、「BはA」とは限らない

>>:  Appleが大規模モデル圧縮技術を革新、大規模モデルを携帯電話に搭載可能に

ブログ    
ブログ    

推薦する

私、シュシュもVRヘッドセットを持っています!コーネル大学の研究者らがマウスの頭蓋骨を開き、脳と行動の没入型研究を行っている。

最近、マウスの世界でも仮想現実の時代が到来しました。はい、すべての人間が VR ヘッドセットを持って...

公正な「データアクセス」の新秩序の構築 AIが都市統治に根付く

最近では、AI テクノロジーがさまざまな業界に大きな影響を与えていることがニュースで頻繁に紹介されて...

ついにAI、BI、ビッグデータ、データサイエンスをわかりやすく説明する人が出てきた

[[427319]] 01 データデータは、携帯電話に残すデジタルフットプリントから健康記録、買い物...

対照学習も次元の崩壊を引き起こすのでしょうか? LeCunとTian Yuandongのチームの新しい研究DirectCLRは、

[[431792]]自己教師学習はコンピューター ビジョンで広く使用されており、手動で注釈を付ける...

エッジ AI ソフトウェア市場は 2030 年までに大幅に成長する見込み

[[414082]]画像ソース: https://pixabay.com/images/id-592...

ディープラーニングを使用してXSSを検出する方法

1. はじめに周知のとおり、ディープラーニングはコンピュータービジョン、自然言語処理、人工知能などの...

このロボットは脳コンピューターインターフェース手術を行い、マスクのニューラリンクは大きな注目を集めている

近年、マスク氏の脳コンピューターインターフェース研究会社ニューラリンクが注目を集めている。 2019...

能力と信頼性の両方を備えることはできますか? GPT-4やGeminiなどのマルチモーダルモデルの評価レポートはこちら

2023 年には、マルチモーダル大規模モデルの飛躍的な発展が見られるでしょう。マルチモーダル大規模言...

人工知能はデータ活用効率を向上させ、他産業とのAI統合を加速させる

コンピューティング能力は、デジタル技術の継続的な発展とデジタル経済時代の中核的な生産性にとって重要な...

PenFedは人工知能を活用して高度なパーソナライゼーションを実現

米国第2位の信用組合であるPenFedは、人工知能を活用して顧客とのやり取りの方法を変えようとしてい...

より良い機械学習にはより良いデータ注釈が必要

Apple の誰かがラベル付きデータを収集するために数億ドルを費やしましたが、まだ良い結果は得られて...

自然特集:バイオニック群ロボットの登場、工学上の大きな進歩

ネイチャー誌の表紙には、工学上の大きな進歩、つまり生物の細胞コロニーを模倣するロボットの登場が発表さ...

新世代のJVMガベージコレクションアルゴリズムがリリースされました

新世代の JVM ガベージ コレクション アルゴリズムをご存知ですか? ここで皆さんにご紹介しましょ...

ディープラーニングの次の段階:ニューラルアーキテクチャの自己学習により、優れたコンピュータビジョンモデルが実現

[[275255]]ディープラーニングは人工知能モデルの先駆けです。画像認識、音声認識、テキスト理解...

感情 AI はデジタルヘルスケアの未来となるでしょうか?

進化するヘルスケアとテクノロジーの世界では、「感情 AI」と呼ばれる画期的なイノベーションが変化の兆...