ChatGPT「コードインタープリター」が正式リリースされました! 30秒で写真を動画に変え、口を動かしてショーを作りましょう

ChatGPT「コードインタープリター」が正式リリースされました! 30秒で写真を動画に変え、口を動かしてショーを作りましょう

家族よ、ついに来たぞ!

先ほど、ChatGPT「コードインタープリター」ベータ版がすべてのPlusユーザーに正式に公開されました。

写真

OpenAIの科学者カルパシー氏もこれを宣伝し、コードインタープリターのベータ版は非常に強力だと述べた。

これはあなたの個人データアナリストです。アップロードされたファイルの読み取り、コードの実行、グラフの生成、統計分析の実行などを行うことができます。コミュニティがその潜在能力を完全に発揮するには、しばらく時間がかかると思います。

写真

少し前、GPT4 の機能低下がインターネット上で騒動を引き起こし、GPT3.5 よりもわずかに優れているだけだと考える人もいました。

そして今、コードインタープリターにより、おなじみの強力な GPT-4 が戻ってきたことを人々に改めて感じさせています。

プラグインがリリースされるとすぐに、多くのネットユーザーが試してみました。

機能ロック解除

では、「コードインタープリター」は具体的に何ができるのでしょうか?

30秒で写真が動画になる

見てください、ネットユーザーの中には実際に ChatGPT を使用して写真を動画に変換した人もいます。その効果はMidjourneyやRunwayよりもさらに爆発的です。

写真

これはどうやって行うのですか?ネットユーザーは完全なチュートリアルセットを提供しました。

ステップ 1: 「コード インタープリター モデル」を開きます。有効にするには、「設定」->「ベータ機能」->「コードインタープリター」に移動します。

写真

ステップ2:

ドロップダウン メニューからコード インタープリター オプションを選択します。次に、アニメーション化したい画像をアップロードします。

ステップ3:

高級レストランの料理を紹介したかったんです。そこで、ChatGPT にこの食べ物の画像を左から右にアニメーション化するよう依頼しました。私の GPT プロンプト (下記参照) を変更することで、独自のアニメーションを作成できます。

具体的なプロンプトは次のとおりです。

写真

ステップ4:

Enterを押します。 30 秒後、ChatGPT からビデオのダウンロード リンクが提供されます。

写真

共同創設者の Greg Brockman は、ffmpeg 呼び出しを記憶できない場合に備えて、画像変換用のコード インタープリターを転送しました。

写真

「コード インタープリター」は本当に素晴らしいことがわかりました。今では、ビデオをカットするには、1 つの文だけが必要です。

写真

「メモリ容量には一定の制限がありますが、小さなファイルなら処理できます。4 秒の Gen-2 ビデオを流してみたところ、最初の 2 秒しかかかりませんでした。すぐに終わりました。」

適切なコードを自動的にテストします。プログラムを書きたい場合は、まずファイルを渡してリクエストし、それから提供されるコードを確認します。

写真

PDFを画像に変換する

国内の有名なインターネット技術ブロガー「Baoyu」は、「コードインタープリター」を使用してPDFを画像に変換しました。

写真

写真

以前は、各ページのコンテンツを 1 つの画像に結合する必要がありましたが、現在は 1 つのプロンプトだけで実行できます。

写真

GIFからビデオへ

写真をビデオに変換するだけでなく、GIF をビデオに変換することもできます。

ChatGPT にネットユーザーが与えたヒントは、私が GIF をアップロードし、5 秒の MP4 を渡して、ナラティブ レンズでゆっくりとズームインするというものです。

写真

GIFをアップロード

写真

最後に、ChatGPTはすぐにビデオを生成しました

写真

さらに、ChatGPT では「マトリックス」GIF も作成できます。

写真

写真

QRコードを生成する

2日前、OpenAIはChatGPTの「コードインタープリター」がまもなく完全にオープンになると発表しました。

QR コードを生成する方法の例を示します。ほんの数語を入力するだけで、タスクを完了できます。

ポケットデータアナリスト

コードインタープリターの最大の使用例はデータ分析です。

例えば、さまざまな国や世界最大の都市の平均寿命データを分析してみましょう(CSV、Word、PDF、ビデオファイルをアップロードできます)

写真

次に、データに話しかけて、必要な質問をします。

または、データから独自のランダムな傾向を抽出して驚きを得るように依頼します。

たとえば、2 つのデータから固有の傾向を見つけて、それを表に表示します。

写真

最後のステップは視覚化です。

データを任意のチャートやグラフに変換します。何よりも素晴らしいのは、ワンクリックで完了することです。

たとえば、ある国の一人当たり GDP と平均寿命の関係を示す散布図を生成します。

写真

このような強力な「データ分析者」を見て、ネットユーザーたちは再びRIPを始めた。

使用ガイドライン

「コードインタープリター」の使い方は?ウォートン・スクール・オブ・ビジネスの教授であるイーサン・モリック氏は、この目的のために特別にガイドを書きました。

写真

まず、モリック氏は、コードインタープリターという名前は、OpenAI が自社製品に悪い名前を付けてきた長い伝統を引き継いでいると指摘した。

なぜなら、これは「コードインタープリタ」と呼ばれていますが、実際にはプログラミングについて何も知らない人にとって最も役立つからです。

本質的には、「コードインタープリター」により、GPT-4 は情報をアップロードおよびダウンロードし、ユーザー向けのプログラムを作成して実行できるようになり、AI はこれまでできなかったさまざまなことを実行できるようになります。

具体的には、AI に問題解決のための一般的なツールボックス (Python でコードを記述) と超大容量メモリ (最大 100 MB、圧縮可能) を提供し、ユーザーはこのツールボックスを AI に統合して LLM を活用できます。

これにより、ChatGPT の以前のバージョンに存在していた多くの問題が解決されます。例えば、

これにより、AI は数学 (複雑なものも含む) を処理し、単語をより正確に処理 (段落内の単語を実際に数えるなど) できるようになります。その根本的な理由は、LLM の数学と言語における本来の弱点に対処する Python コードを記述できることです。

例えば、下の図のようになります。

写真

ご覧のとおり、コードインタープリターは段落内の単語数を正確に計算できます。

さらに、「コードインタープリター」は幻覚や捏造の可能性を減らします。

AI が Python を直接使用する場合、コードは AI を正直に保つのに役立ちます。理由は簡単です。コードが正しくない場合、Python はエラーを報告します。コードはデータに対して操作されるため、AI はデータに誤った情報を挿入することはできません。

もちろん完璧ではありません。 AIが幻覚を起こす可能性はまだありますが、実際にはまれであり、コードやデータ自体に影響を与える可能性は低いです。

これにより、AI は汎用人工知能に一歩近づき、さまざまな問題をコードで解決できるようになります。

さらに、GPT-4 は、新しい興味深い方法で「コードインタープリター」をいつ使用するかを決定するのが非常に得意です。

モリック氏は例を挙げた。GPT-4に地球が丸いことをユーザーに証明するよう指示すると、GPT-4は「コードインタープリター」を使用して、テキストとコードや画像を組み合わせた複数の引数を提供する。

写真

以前は、プログラミングを必要とするさまざまな職業の人々は、ある程度のコードの書き方を知っておく必要がありましたが、書いた後は自分でデバッグする必要がありました。これまでの AI が何らかの手助けをしてくれたとしても、Python の学習基盤がない人にとっては依然としてかなり難しく、コードを繰り返し修正するには AI の力に頼らなければなりません。

そして今では、「コードインタープリター」により、AI が自らエラーを修正し、デバッグできるようになりました。

次に、Mollick 氏は、多くのユーザーの悩みの種である「コード インタープリター」を使用してデータを処理する方法について説明しました。

モリック氏は、「コードインタープリター」は非常に高度なレベルで動作し、多くの複雑な定量分析を自動的に処理し、非常に洗練されたデータ手法を実行できると述べた。

ユーザーはプラス記号をクリックするだけで、ZIP ファイルなどの圧縮データも含め、簡単にデータをアップロードできます。

写真

同時に、ユーザーがデータを提供する際にプロンプ​​トを表示できると最適です。すると、AIは文脈からデータの意味や構造を理解できるようになります。

さらに、モリック氏は、「コードインタープリター」を使用すると、ユーザーは AI と「会話」する可能性が高くなり、厳密で簡潔なプロンプトを書くために頭を悩ませる必要がなくなると指摘した。

データ アナリストとチャットするのと同じように、人間と話すのと同じように「コード インタープリター」と通信します。

しかし、ここでは 2 つの特殊なケースがあり、プロンプトに似たものを記述する必要があります。

1 つは、AI が自分のできることを忘れてしまうことがあるため、そのときに AI を起動するためのプロンプトが必要になることです。

たとえば、「GIF を作成できます。ぜひお試しください。」

別の状況としては、ユーザーが結果に満足できない場合、ユーザーはプロンプトを使用して「コード インタープリター」に結果を最適化させることができます。

たとえば、「この結果についてさらにテストを実行してください」または「このグラフを改善できますか?」

写真

データをロードした後、GPT はデータのマージとクリーニング操作を実行できます。具体的な処理方法は非常に複雑ですが、前述のように「コードインタープリター」はあなたと対面するデータアナリストのようなものだと考えてください。

同時に、モリック氏は、万が一エラーがあった場合に備えて、AI が自己修正した後に結果を確認するのが最善であるとユーザーに注意を促した。

写真

モリック氏はそれを実践した。彼は「コードインタープリター」に、スーパーヒーローがどんな超能力を持っているかを予測する予測モデルを作成するように依頼した。

ご覧のとおり、Code Explainer はランダム フォレスト ディストリビューターを構築します。

写真

もちろん、実際の操作中は、ユーザーは GPT と「さらに通信」する必要があります。モリック氏は、AI が数値データ手法を使用して欠落データを推定することを望んでいません。モリック氏は、欠落部分を直接破棄したいと考えています。

しかし、GPT と話し合い、処理方法の変更を求めることも可能だと指摘した。

その後、モリック氏は GPT に「別の複雑で興味深い分析を実行できますか?」と質問しました。彼は、「コードインタープリター」が選択した分析方法のいくつかに感銘を受けたと語った。

下の写真の通りです。

「コードインタープリター」は超大国のネットワーク状況を巧みに分析します。ご覧のとおり、その方法は多様で非常に興味深いものです。

写真

「コードインタープリター」の最も印象的な点は、おそらくその推論能力です。モリック氏はこれを非常に「人道的」だと総括した。

さらに、視覚化のインタラクティブ性のレベルはオンラインのままであり、継続的に向上しています。ユーザーは AI に出力コンテンツの改善や変更を継続的に依頼できます。

モリック氏は AI に、3D チャートを含む 6 つのチャートを含むインタラクティブな表を作成させました。

グラフをより美しくするために、モリック氏はプロンプトを入力し、結果を調整し続けました。

最終結果は、下の画像の右側のようになります。

写真

10の驚くべき魔法

ネットユーザー@GPTDAOCNは最近、ChatGPTの衝撃的な使用例トップ10をまとめました。

写真

コードインタープリタの視覚化

1. GIF を MP4 に変換: この機能を使用すると、動的な画像 (GIF) をビデオ ファイル (MP4) に変換して、共有や使用を簡単に行うことができます。

2. さまざまなグラフを作成する: この機能を使用すると、棒グラフ、折れ線グラフ、円グラフなどのさまざまなグラフを生成し、データを直感的に表示および分析できます。

3. 画像から色を抽出して PNG パレットを作成する: この機能を使用すると、任意の画像から主要な色を抽出し、PNG 形式のパレットを生成できます。

4. データをクリーンアップして詳細な視覚化を生成する: 乱雑なデータがある場合、この機能を使用すると、データをクリーンアップして整理し、明確な視覚化グラフィックに変換できます。

5. CSV ファイルを GIF に変換: この機能は、CSV (カンマ区切り値) ファイル内のデータを動的に表示し、GIF 画像を生成します。

6. プレイリストを分析して音楽の好みをまとめる: この機能を使用すると、音楽のプレイリストを分析して音楽の好みをまとめることができます。

7. データセットを完全に機能する HTML ウェブサイトに変換する: この機能を使用すると、データを完全に機能するウェブサイトにすばやく変換し、表示および共有できます。

8. ダウンロード可能な株式データセットを作成する: この機能を使用すると、より詳細な分析や調査のためにダウンロードできる株式データセットを作成できます。

9. 画像をテキスト ファイルに変換: 画像からテキストを抽出する必要がある場合、この機能を使用すると、画像内のテキストをテキスト ファイルに変換できます。

10. フォーマットされていないデータの詳細な分析: 指定された形式ではない生データの場合、この機能を使用すると詳細な分析を実行して貴重な情報を取得できます。

実際、コードインタープリターの使用例はこれらよりもはるかに多くあります。

ユーザーコメント

ChatGPT コードインタープリターを試しています。今のところ、私が推奨できるのは、「すべての開発者が今すぐに作業を開始すべき」ということだけです。

コードインタープリターによって何人の人の人生が台無しになったでしょうか?毎日多くの管理者が非効率的にデータを処理していますが、今では自然言語だけでオフィスの自動化を実現できます。

<<:  大規模モデルを低コストで便利に使用するには? Amazon Web Services が生成型 AI を実現する方法

>>:  KServe、Kubernetes環境に基づく高度にスケーラブルな機械学習デプロイメントツール

ブログ    
ブログ    
ブログ    

推薦する

...

サッカーボールとハゲ頭の区別がつかないAIがプレミアリーグのファンにまたもや嫌われる

スポーツにおける AI はどの程度信頼できないのでしょうか?先月、スコットランドサッカー選手権の試合...

データは1/5000に縮小されたが、モデルの精度は2倍に。Googleの新しい「蒸留法」が人気に

[[441258]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

...

人工知能の10年を振り返る: CNN、AlphaGo…世界をどのように変えたか

過去 10 年間に AI で達成された重要な進歩を振り返ります。人工知能技術は過去 10 年間で飛躍...

...

チップ大手は、写真を撮ることよりも面白くないこれらの新しいAI技術を秘密裏に開発している

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

勾配降下法から準ニュートン法まで: ニューラル ネットワークをトレーニングするための 5 つの学習アルゴリズム

ニューラル ネットワークでは、システムの学習プロセスは一般にトレーニング アルゴリズムによって支配さ...

100万個のニューロンをリアルタイムでスキャンできるようになりました。脳細胞活動の画像化における新たなブレークスルーです。

数年前なら、コンピューターが 10,000 個のニューロンの活動を同時に記録していたらニュースになっ...

ワンクリックで細い毛を切り取る。これはAdobeの最新のAI切り抜きアルゴリズムで、近日公開予定

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ETHは、画像の超解像と画像の再スケーリングを考慮して、新しい統合フレームワークHCFlowを提案しています。

[[423154]]近年、正規化フローモデルは、画像超解像(画像SR)[SRFlow、ECCV20...

人工知能と5Gの組み合わせは医療業界の診断と治療のモデルとプロセスを変えるだろう

COVID-19の世界的パンデミックにより、医療におけるテクノロジーの活用が加速しました。 2021...

清華大学:過去10年間の人工知能の発展の概要:中国は急速な進歩を遂げ、その特許は世界の70%を占める

1. 急速な発展の10年1. 論文の発表状況<br /> 人工知能は過去10年間で急速に...

...