今週、OpenAIのビデオAIツール「Sora」が登場するや否や大きな話題を呼んだ。 「仕事を失う」という恐怖は、本当に多くの人々を襲っています。 写真 しかし、アマゾンのエンジニアであるキャメロン・グールド氏は、AIをそれほど恐れる必要はなく、AIによって職を失うこともないと考えている。 なぜ?理由は次の通りです。 プロンプトのパラドックスまず、生成 AI をクリエイティブ コンテンツに適用すると、生成されるのは一般的に画像、動画、一般的なノンフィクション コンテンツになります。 生成 AI モデルにプロンプトを与えることは、あなたが言うことをすべて文字通りに受け止めてあなたを困らせることだけを目的とする意地悪な子供のベビーシッターをするようなものです。 言葉遣いは正確でなければならず、結果をまったく異なる方向に傾ける可能性のある重要でない詳細に 1 文字も無駄にしてはいけません。 しかし同時に、モデルが誤解しないように、できるだけ詳細な情報を提供する必要があります。 この矛盾した操作は、とにかくひどいです! コンピューターと一方的に会話をしながら、なぜ期待した結果が得られなかったのかを理解しようとすると、3 時間も頭を悩ませ続けることになるかもしれません... 写真 グールド氏は、ソフトウェアエンジニアとしてのキャリアの中で、コンピューターとのこのような一方的な対話には慣れてきたが、生成型 AI の経験は間違いなくそれよりも悪いと語った。 これは、べき等関数を備えた予測可能なプログラミング言語ではありません。 写真 これは完全なブラック ボックスであり、同じ入力が与えられても、ほぼ毎回まったく異なる結果が生成される可能性があります。 AI にプロンプトの一貫性を保つように依頼しても、AI が言うことを聞かない場合があります。 時価総額数十億ドルの企業はこの現実に悩まされている。 最近、カナダの裁判所は、チャットボットが誤解を招くアドバイスをしたために乗客が航空券のほぼ2倍の金額を支払わされたとして、エア・カナダが乗客の1人に賠償金を支払うよう判決を下した。 写真 本当に早いですが… もちろん、一貫性の面での欠点があるにもかかわらず、生成 AI は物事を迅速に生産するのに役立ちます。 写真 たとえば、上の写真は生成 AI を使用して作成されており、作成にはわずか数秒しかかかりませんでした。 つまり、AI によってアーティストよりも速く絵を描くことができるようになる可能性があるのです。 Sora を使用すると、一般の人々が以前よりも何倍も速く、より複雑なメディア マテリアルを生成することも可能になります。 では、1 人で複数人分の仕事をこなせるようになった今、アーティスト、ソフトウェア エンジニア、コピーライターの数は本当に減るのでしょうか? いいえ、詳細は間違っています。答えはそれほど単純ではありません。 生成 AI を使用してアートを作成するときに、「いや、これは私が望んでいたものではない」と思うことがあります。 これはフォーラムでよく見られる意見でもあります。 これはプロンプトに詳細が欠けているためであり、より具体的なプロンプトを与える必要があると主張する人もいるかもしれません。 この見解は理にかなっています。 写真 私たち自身の映画と、1億ドル以上の収益を上げているプロの映画との違いは何でしょうか? 私たち自身の個人ブログとプロの専業ライターのブログの違いは何でしょうか? 自分たちで制作したゲーム ビデオ タイトルと 30 時間の AAA ビデオ ゲーム タイトルの違いは何でしょうか? 答えは細部にあります。 AI 生画像 アマチュアとプロを分けるのは細部です。 生成 AI を使用して、プロフェッショナルなコンテンツと同じくらい印象的な作品を作成したい場合は、多くの詳細を含むプロンプトが必要になります。 また、モデルが望むものを生成するには、多くの試行錯誤が必要です。 生成 AI は、オートコンプリート、コンパイラ、スペルチェッカー、その他の支援ツールと同じ単なるツールです。 それは、自分自身の仕事でない限り、あなたのために仕事をすることはありません。 Sora の例に戻りましょう。 無音ビデオのみを生成できます。音声も会話もなく、物体も話したり音を出したりすることはできません。 写真 しかし、映画を作るには、それを使う必要があります。 スクリプトを生成しますか? 台本を読んでいますか? スクリプトに合わせたビデオを生成しますか? 現代の映画が興味深いのはなぜでしょうか? 突然、仕事を完了するために、さまざまな生成 AI ツールを統合する必要が生じました。 確かに、OpenAI にはビデオに音楽を追加できる Jukebox という音楽生成ツールがありますが、セリフを追加することはできません。 写真 ビデオにセリフを追加するにはどうすればいいですか?その仕事はあまりにも困難に思えます。 特定のシーンのビデオを生成するだけでなく、シーン内の登場人物の口の動きやセリフの一貫性を保つ必要もあります。 さらに、ビデオ ジェネレーターは単語がどのように話されているかを知る必要があります。音色だけでなくリズムも同様です。 これらすべての詳細に対処するには、どれだけの人手が必要になるか想像してみてください。 細かいところはかなり難しくなります。 あらゆるレベル、あらゆるステップにおいて、実質的な結果をもたらす詳細事項が多数存在します。 写真 グールド氏は最近、「現実には驚くほど多くの詳細がある」というブログ記事を読んでとても気に入ったと語った。 写真 現実の詳細は無限ですが、AI モデルのトークンは限られています。 それだけでは限界があり、その後は仕事をやり遂げるために他の人に頼る必要があります。 人間は今でも圧倒的に重い荷物を持ち上げています。 写真 宇宙の植民地化に関する重要な詳細 詳細は少なく、多様性は増す細部にこだわるのは本当に疲れるようです。 シンプルにしておくとどうなるでしょうか?ほんの数分で書ける非常に短い説明だけを提供する必要がある場合はどうでしょうか? 最終的には多種多様な結果が得られますが、そのほとんどはあなたが考えていたものとはまったく一致しません。 プロンプトは非常に普遍的であるため、必要なものを見つけるには、何百、何千もの結果を調べる必要があります。 使える結果が見つからない可能性もあります。 プロンプトが単純すぎる場合は、モデルの豊かな想像力により、選択できるアレンジが無限に提供されます。 たとえば、「a man」というプロンプトを入力すると、あらゆる種類の男性が見つかります。 写真 しかし、実際に私が求めていたのは、青い髪、茶色い目、口ひげ、そしてフード付きの黒いジャケットを着た男性でした。 ヒントとして「a man」だけを入力した場合、正確な出力を見つけるのにどれくらいの時間がかかりますか? 深さと幅の間には、労力を最小限に抑えられるバランスがあります。 これには、詳細についての批判的思考と多くの検索が必要です。 AIは人間に取って代わることはできないでは、なぜ AI は人間に取って代わらないと言えるのでしょうか? なぜなら、ビジネスは画像やビデオクリップの生成といった小さな問題を解決するために存在しているわけではないからです。 企業とは、利害関係者にとってより大規模で複雑な問題を解決することです。 これらの問題を解決する上で最も難しいのは物流です。 大規模で複雑な問題を解決するには、大規模な問題解決者のグループによる時間と労力が必要であり、物事を前進させるには、そのグループ全員が他の問題解決者によって組織化される必要があります。 ランダムに 2 人を選び、自分の仕事を管理および整理するように依頼すると、基準やスケジュールが一貫していない可能性が高くなります。 これらを連携させる場合は、同時に作業して同じ品質の結果を生み出すように標準を設定する必要があります。 凝集性は強みであり、個々のユニットの一貫性を保つために何らかの作業を行う必要があります。 単独で活動するチームはタスクを正常に達成できますが、単一の環境に複数のチームを導入すると、多くの競合が発生します。 写真 相互に依存する複数のチームが共通の目標に向かって作業する場合、有意義な成果を達成するには、一定レベルの結束が必要です。 この「結束」作業は実際には非常に複雑であり、多くの場合非論理的で感情的な対人関係の対立を解決することが必要になります。 明らかに、AI はこの種の紛争を解決することはできません。 要約すれば、
明らかに、ロボットはこれらの仕事をこなす能力がまったくなく、そのパフォーマンスはひどいものとなるでしょう。 AIはあなたの仕事を奪わない この事実は、生成 AI の現状を詳しく見てみると明らかになります。 現時点ではこの作業を自動化する方法はありません。 プロンプト インターフェースとモデルにおける自律性と批判的思考の欠如は、重要な制限につながります。 はい、生成 AI は確かに作業効率の向上に役立ちますが、それだけです。 写真 「AI はあなたの仕事を奪うことはない」という意見に賛同する人はますます増えています。 あなたにとって本当の脅威は、あなたよりも巧みに AI ツールを使用できる人です。 生成 AI は作業をスピードアップするのに役立つ優れたリソースですが、作業を完全に自動化することはできません。 必要なのは、それらをツールボックスに追加して習得することだけです。 参考文献: https://www.camggould.com/posts/The-AI-Endgame/ |
<<: MATRIX: 社会シミュレーションは、GPT4よりも配慮した大規模なモデル値の自己整合を促進します
1: VGGの紹介とモデル構造VGGはVisual Geometry Groupの略で、オックスフォ...
「アイ、ロボット」は蔡蔡が子供の頃に特に好きだった映画であり、今でも古びていない。子どもの頃は、映...
統計学と機械学習は密接に関連した2つの分野です。実際のところ、この 2 つの境界線は非常に曖昧になる...
2020 年に私たちがどうなるかは誰も予測できませんでした。過去 6 か月だけでも、過去 10 年間...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[233174]]もしある日私を殴りたくなったら、ただ殴って終わりにできると思いますか?今はそんな...
同国初の大規模医療モデルはすでに患者を「診察」している。最近、病院内の AI 医師の実際の監視データ...
CPU 開発における大きな問題は、ChatGPT とのチャットで解決できるでしょうか?ニューヨーク州...
F# の並列ソート アルゴリズムで最も一般的な方法の 1 つは、まず処理するデータを複数の部分に分割...
回答者の大多数 (59.4%) は明確なインシデント管理プロセスを導入しており、自動化のレベルはニー...
米国の自動運転業界を取り巻く規制環境は静かに変化しつつある。過去10年間、米国は世界の自動運転分野に...
最近、2020年中国人工知能産業年次大会が蘇州で開催されました。大会で発表された「中国人工知能発展報...
現在、知能ロボットは急速な発展期に入り、生活のあらゆる分野で非常に重要な役割を果たし、人類にとっての...