ChatGPT の新機能がオンラインになりました。これでビデオ編集が簡単になりますか?

ChatGPT の新機能がオンラインになりました。これでビデオ編集が簡単になりますか?

最近、OpenAIが数か月間隠していた大きな動きがついに公開されました。それが「コードインタープリター」です。

名前を見ると、ちょっと冷笑的に感じるかもしれません。コードを書くのを手助けするだけのものではないですか? 似たようなプラグインはどこにでもあります。今さら登場する意味は何ですか?

やあ!その名前はコードインタープリターと呼ばれていますが、コードを書くのに役立ちません。

簡単に言えば、これはユーザーと AI の間の翻訳機に相当し、自然言語を通じてユーザーのニーズをプログラムが解決できる具体的なソリューションに翻訳します。また、処理する必要があるファイルをアップロードするための 100 MB のアップロード ファイル スペースも提供されます。

数か月前、コードインタープリタが一部の開発者に試用版として公開されました。しばらく試用した後、ブロガーはコードインタープリタを使用した後、ChatGPT が質的に飛躍したことを発見しました。たとえば、ChatGPT は非常に複雑な数学の問題を解くことができ、意味不明な文字の発生も減り、実用的なアプリケーションの解決にも優れています。

写真

そこで Shichao 氏は待ちきれず、ほぼ 1 か月間アクセスしていなかった OpenAI の公式 Web サイトにすぐにアクセスし、このコード インタープリターの強力さを確かめました。

コード インタープリターを試すための最初のステップは、「設定」 - 「ベータ機能」でコード インタープリターをオンにすることです。

写真

次に、GPT-4 選択ボックスで、コードインタープリターを選択すると、スムーズに試すことができます。

Shichao さんは定期的にビデオを編集しているので、この機能を使用するときに最初にしたのは、ビデオをカットするように依頼することでした。

Shichao は最初に 115 秒のビデオをアップロードし、その後、ChatGPT に真ん中の 10 秒をカットするのを手伝ってくれるように依頼しました。

その結果、ChatGPT はまず私に反論し、私の説明が不明瞭であり、さらに情報が必要であると述べました。

まあ、それは間違いなく私のせいなので、真ん中の10秒間にするように言いました。

多くのコード処理の後、ChatGPT が「overwatching_subclip.mp4」というファイルを出力することが明らかになりました。

ダウンロードしてみると、確かに元の動画の50~60秒のクリップで、ちょうど10秒でした。

写真

次に、倉庫保管テーブルをアップロードし、50 を超える残りの在庫をリストするように依頼しました。

項目をリストし、新しいテーブルに統合して、アニメーション棒グラフ GIF を作成します。

写真

しかし、コードは提供されており、問題も理解されていますが、コードを自分で実行するように求められます。

また、彼のオペレーティング環境では、GIF アニメーションの直接生成はサポートされていないとも述べています。

しかし、私はコードを書きたくないのであなたを使用しています。なぜ自分で実行するように要求するのですか?

そこで Shichao は ChatGPT に少し励ましの言葉をかけ、GIF を生成できるから勇気を出して試してみるように伝えました。

予想外に、実際に反応してGIFを直接生成してくれました

ファイルにはダウンロード リンクも提供されており、教育を奨励することが依然として非常に有用であることがわかります。

ただし、生成された GIF データ チャートは、アニメーションの説明が不明瞭なためか、動き回ったり、中国語部分のテキスト エンコードも文字化けしたりしていますが、全体的にはタスクはかなりうまく完了しており、残っているのはいくつかの詳細だけです。

そこで、ChatGPT に在庫数が 50 以上のオブジェクトの特徴を分析して、それを表す円グラフを作成するように依頼しました。

今回、ChatGPTはまずフォームをリスト化し、次に円グラフを描き、「DBTWデュポン紙袋」が最大の割合を占めていると分析しました。

写真

Shichaoさんはこれらのアイテムの特徴について質問を続け、ChatGPTもデータに基づいてうまくまとめてくれました。

ここまで試してみた時点で、Shichao はすでに少し感心していたと言わざるを得ません。以前、彼が直接ビデオ編集を手伝ってくれたとき、Shichao は少し驚いていましたが、今回はレポート統計によって作業効率が本当に向上しました。

その後、Shichao はコード インタープリターの他の機能を試しました。まず、不可能に思えるが実際には不可能ではないことをコードを使って示すことを考えるのに役立つかどうか尋ねました。

写真

今回は、ChatGPT が 3D 立方体を描画するためのコードを提供します。実行すると、2D 平面に投影された 3D 立方体が生成されます。

ChatGPTはShichao氏に対し、これはコンピュータグラフィックスの基本的な概念であり、ゲーム、映画、仮想現実など、さまざまなアプリケーションで広く使用されていると語った。

写真

その後、フラクタルパターンを描くなど、他の多くの問題にも挑戦しました。

写真

プロット機能もあり、データセットの散布図が描画されます。

写真

このコードインタープリタがあれば、今後の作業の多くは基本的に会話だけで行えるようになると言えます。

私の意見では、今回 ChatGPT がリリースしたコードインタープリターは、少し前に非常に人気があったオープンソースプロジェクト AutoGPT に非常に似ています。

しかし比較すると、コード インタープリターはインターネットに接続できないことを除けば、その機能は AutoGPT よりもはるかに強力です。ニーズを理解して解決策を見つけるだけでなく、必要なデータ チャートを自動的に描画するのにも役立ちます。

大規模言語モデルのマルチモーダル性がまさに実現されたといえる。

最後に、Shichao 氏は ChatGPT に、まだ証明されていない難しい数学の問題である「リーマン予想」についても質問しました。

写真

残念ながら、Shichao がどれだけ奨励しても、今回は ChatGPT は何も言わなかった。 。 。

写真

現状では人間が解決できない問題をAIに解決させることは不可能のようです。

しかし、現在の AI 開発の速度では、確実なことは誰にも言えません。

おそらく 925 回の反復を経て、AI は宇宙の究極の問いにさえ数秒で答えることができるようになるでしょう。

<<: 

>>:  xAI Twitterライブ放送:GoogleやOpenAIと直接競合する

ブログ    
ブログ    
ブログ    

推薦する

ザッカーバーグは涙ながらに300人のチームを解散させた! Meta、Google、その他の大手企業によるMetaverse OSをめぐる戦いが正式に始まったのでしょうか?

Appleの春のカンファレンスまで残り4日となりました。カラフルなAR招待状が届きました。これはク...

清華大学とアイデアルは、自動運転機能を向上させる視覚言語モデルDriveVLMを提案した。

生成AIと比較して、自動運転も近年AIの研究開発が最も活発に行われている分野の1つです。完全自動運転...

...

...

フォーブス誌の2020年AIに関するトップ10予測: 人工知能はますます「疎外」されつつある

人工知能 (AI) は間違いなく 2010 年代のテクノロジーのテーマであり、新しい 10 年が始ま...

トレーニング時間とパラメータの数は100分の1に削減され、ラベルは予測に直接使用され、GNNを超えるパフォーマンスを実現

従来のラベル伝播法とシンプルなモデルを組み合わせると、一部のデータセットでは現在の最適な GNN の...

専門家:歩行者の安全問題を解決するために都市は自動運転だけに頼ることはできない

自動運転技術が業界全体で開発のマイルストーンに到達し続ける一方で、都市は自動運転車(AV)の目標を補...

AIアルゴリズムエンジニアの涙の体験談

[[425033]]私たちはしばらくの間、展開モデルの最適化に取り組んできました。ここ数日でようやく...

機械学習アルゴリズムにおける分類知識の要約

この記事では、機械学習アルゴリズムにおける非常に重要な知識である分類、つまり入力データが属するカテゴ...

機械学習は言語から意味を抽出するのにまだ苦労している

私たちは幼児期から言語を吸収し始めます。簡単な単語は1年目か2年目に出てきます。 6 歳までに語彙は...

...

2021 年を迎えるにあたり、人気の GNN はどのアプリケーション分野で存在感を発揮するのでしょうか?

近年、グラフ構造の強力な表現力により、機械学習の手法を用いたグラフ解析の研究が注目を集めています。グ...

何?ニューラルネットワークは新しい知識も生み出せるのでしょうか?

作業を実行するための明示的なアルゴリズムを知らなくても、特定のタスク用にニューラル ネットワーク (...

...