ソラは人間の代わりにはなれない！アマゾンのエンジニアは主張：実際の仕事上の対立はAIでは解決できない

今週、OpenAIのビデオAIツール「Sora」が登場するや否や大きな話題を呼んだ。

「仕事を失う」という恐怖は、本当に多くの人々を襲っています。

写真

しかし、アマゾンのエンジニアであるキャメロン・グールド氏は、AIをそれほど恐れる必要はなく、AIによって職を失うこともないと考えている。

なぜ？理由は次の通りです。

プロンプトのパラドックス

まず、生成 AI をクリエイティブコンテンツに適用すると、生成されるのは一般的に画像、動画、一般的なノンフィクションコンテンツになります。

生成 AI モデルにプロンプトを与えることは、あなたが言うことをすべて文字通りに受け止めてあなたを困らせることだけを目的とする意地悪な子供のベビーシッターをするようなものです。

言葉遣いは正確でなければならず、結果をまったく異なる方向に傾ける可能性のある重要でない詳細に 1 文字も無駄にしてはいけません。

しかし同時に、モデルが誤解しないように、できるだけ詳細な情報を提供する必要があります。

この矛盾した操作は、とにかくひどいです!

コンピューターと一方的に会話をしながら、なぜ期待した結果が得られなかったのかを理解しようとすると、3 時間も頭を悩ませ続けることになるかもしれません...

写真

グールド氏は、ソフトウェアエンジニアとしてのキャリアの中で、コンピューターとのこのような一方的な対話には慣れてきたが、生成型 AI の経験は間違いなくそれよりも悪いと語った。

これは、べき等関数を備えた予測可能なプログラミング言語ではありません。

写真

これは完全なブラックボックスであり、同じ入力が与えられても、ほぼ毎回まったく異なる結果が生成される可能性があります。

AI にプロンプトの一貫性を保つように依頼しても、AI が言うことを聞かない場合があります。

時価総額数十億ドルの企業はこの現実に悩まされている。

最近、カナダの裁判所は、チャットボットが誤解を招くアドバイスをしたために乗客が航空券のほぼ2倍の金額を支払わされたとして、エア・カナダが乗客の1人に賠償金を支払うよう判決を下した。

写真

本当に早いですが…

もちろん、一貫性の面での欠点があるにもかかわらず、生成 AI は物事を迅速に生産するのに役立ちます。

写真

たとえば、上の写真は生成 AI を使用して作成されており、作成にはわずか数秒しかかかりませんでした。

つまり、AI によってアーティストよりも速く絵を描くことができるようになる可能性があるのです。

Sora を使用すると、一般の人々が以前よりも何倍も速く、より複雑なメディアマテリアルを生成することも可能になります。

では、1 人で複数人分の仕事をこなせるようになった今、アーティスト、ソフトウェアエンジニア、コピーライターの数は本当に減るのでしょうか?

いいえ、詳細は間違っています。

答えはそれほど単純ではありません。

生成 AI を使用してアートを作成するときに、「いや、これは私が望んでいたものではない」と思うことがあります。

これはフォーラムでよく見られる意見でもあります。

これはプロンプトに詳細が欠けているためであり、より具体的なプロンプトを与える必要があると主張する人もいるかもしれません。

この見解は理にかなっています。

写真

私たち自身の映画と、1億ドル以上の収益を上げているプロの映画との違いは何でしょうか?

私たち自身の個人ブログとプロの専業ライターのブログの違いは何でしょうか?

自分たちで制作したゲームビデオタイトルと 30 時間の AAA ビデオゲームタイトルの違いは何でしょうか?

答えは細部にあります。

AI 生画像

アマチュアとプロを分けるのは細部です。

生成 AI を使用して、プロフェッショナルなコンテンツと同じくらい印象的な作品を作成したい場合は、多くの詳細を含むプロンプトが必要になります。

また、モデルが望むものを生成するには、多くの試行錯誤が必要です。

生成 AI は、オートコンプリート、コンパイラ、スペルチェッカー、その他の支援ツールと同じ単なるツールです。

それは、自分自身の仕事でない限り、あなたのために仕事をすることはありません。

Sora の例に戻りましょう。

無音ビデオのみを生成できます。音声も会話もなく、物体も話したり音を出したりすることはできません。

写真

しかし、映画を作るには、それを使う必要があります。

スクリプトを生成しますか?

台本を読んでいますか?

スクリプトに合わせたビデオを生成しますか?

現代の映画が興味深いのはなぜでしょうか?

突然、仕事を完了するために、さまざまな生成 AI ツールを統合する必要が生じました。

確かに、OpenAI にはビデオに音楽を追加できる Jukebox という音楽生成ツールがありますが、セリフを追加することはできません。

写真

ビデオにセリフを追加するにはどうすればいいですか?その仕事はあまりにも困難に思えます。

特定のシーンのビデオを生成するだけでなく、シーン内の登場人物の口の動きやセリフの一貫性を保つ必要もあります。

さらに、ビデオジェネレーターは単語がどのように話されているかを知る必要があります。音色だけでなくリズムも同様です。

これらすべての詳細に対処するには、どれだけの人手が必要になるか想像してみてください。

細かいところはかなり難しくなります。

あらゆるレベル、あらゆるステップにおいて、実質的な結果をもたらす詳細事項が多数存在します。

写真

グールド氏は最近、「現実には驚くほど多くの詳細がある」というブログ記事を読んでとても気に入ったと語った。

写真

現実の詳細は無限ですが、AI モデルのトークンは限られています。

それだけでは限界があり、その後は仕事をやり遂げるために他の人に頼る必要があります。

人間は今でも圧倒的に重い荷物を持ち上げています。

写真

宇宙の植民地化に関する重要な詳細

詳細は少なく、多様性は増す

細部にこだわるのは本当に疲れるようです。

シンプルにしておくとどうなるでしょうか?ほんの数分で書ける非常に短い説明だけを提供する必要がある場合はどうでしょうか?

最終的には多種多様な結果が得られますが、そのほとんどはあなたが考えていたものとはまったく一致しません。

プロンプトは非常に普遍的であるため、必要なものを見つけるには、何百、何千もの結果を調べる必要があります。

使える結果が見つからない可能性もあります。

プロンプトが単純すぎる場合は、モデルの豊かな想像力により、選択できるアレンジが無限に提供されます。

たとえば、「a man」というプロンプトを入力すると、あらゆる種類の男性が見つかります。

写真

しかし、実際に私が求めていたのは、青い髪、茶色い目、口ひげ、そしてフード付きの黒いジャケットを着た男性でした。

ヒントとして「a man」だけを入力した場合、正確な出力を見つけるのにどれくらいの時間がかかりますか?

深さと幅の間には、労力を最小限に抑えられるバランスがあります。

これには、詳細についての批判的思考と多くの検索が必要です。

AIは人間に取って代わることはできない

では、なぜ AI は人間に取って代わらないと言えるのでしょうか?

なぜなら、ビジネスは画像やビデオクリップの生成といった小さな問題を解決するために存在しているわけではないからです。

企業とは、利害関係者にとってより大規模で複雑な問題を解決することです。

これらの問題を解決する上で最も難しいのは物流です。

大規模で複雑な問題を解決するには、大規模な問題解決者のグループによる時間と労力が必要であり、物事を前進させるには、そのグループ全員が他の問題解決者によって組織化される必要があります。

ランダムに 2 人を選び、自分の仕事を管理および整理するように依頼すると、基準やスケジュールが一貫していない可能性が高くなります。

これらを連携させる場合は、同時に作業して同じ品質の結果を生み出すように標準を設定する必要があります。

凝集性は強みであり、個々のユニットの一貫性を保つために何らかの作業を行う必要があります。

単独で活動するチームはタスクを正常に達成できますが、単一の環境に複数のチームを導入すると、多くの競合が発生します。

写真

相互に依存する複数のチームが共通の目標に向かって作業する場合、有意義な成果を達成するには、一定レベルの結束が必要です。

この「結束」作業は実際には非常に複雑であり、多くの場合非論理的で感情的な対人関係の対立を解決することが必要になります。

明らかに、AI はこの種の紛争を解決することはできません。

要約すれば、

企業は多くの人々や企業の大きな問題を解決することで利益を上げます
大きな問題は多くのチームが関与するため解決が難しい
人間関係の対立を解決し、結束を維持するために、これらのチームを調整する方法を慎重に計画する必要があります。
人間関係の紛争を解決するには、人こそが最も信頼できる資源である

明らかに、ロボットはこれらの仕事をこなす能力がまったくなく、そのパフォーマンスはひどいものとなるでしょう。

AIはあなたの仕事を奪わない

この事実は、生成 AI の現状を詳しく見てみると明らかになります。

現時点ではこの作業を自動化する方法はありません。

プロンプトインターフェースとモデルにおける自律性と批判的思考の欠如は、重要な制限につながります。

はい、生成 AI は確かに作業効率の向上に役立ちますが、それだけです。

写真

「AI はあなたの仕事を奪うことはない」という意見に賛同する人はますます増えています。

あなたにとって本当の脅威は、あなたよりも巧みに AI ツールを使用できる人です。

生成 AI は作業をスピードアップするのに役立つ優れたリソースですが、作業を完全に自動化することはできません。

必要なのは、それらをツールボックスに追加して習得することだけです。

参考文献:

https://www.camggould.com/posts/The-AI-Endgame/

<<: MATRIX: 社会シミュレーションは、GPT4よりも配慮した大規模なモデル値の自己整合を促進します

>>: 2024年の製造業の現状：完全デジタル化

ConvNet と Transformer のどちらが優れていますか? Metaが4つの主要な視覚モデルを評価、LeCunが好評価

ブログ

ChatGPTをよりスムーズに使用するためのツール「Pandora」

ブログ

5G の出現は AI 連合学習にどのような影響を与えるでしょうか?

ブログ

第4回パラダイム NeurIPS 2020: ナレッジグラフ埋め込みの自動化

ブログ

機械学習の再考: 人工知能はどのようにして「記憶を失う」ことを学ぶのか?

ブログ

JavaScript による機械学習の例 10 選

ブログ

エッジAIとは何ですか?

ブログ

2月10日に職場復帰ラッシュが到来し、北京は「急速AI温度検出器」の配備を開始した。

ブログ

ソラは人間の代わりにはなれない！アマゾンのエンジニアは主張：実際の仕事上の対立はAIでは解決できない

プロンプトのパラドックス

いいえ、詳細は間違っています。

詳細は少なく、多様性は増す

AIは人間に取って代わることはできない

ConvNet と Transformer のどちらが優れていますか? Metaが4つの主要な視覚モデルを評価、LeCunが好評価

ChatGPTをよりスムーズに使用するためのツール「Pandora」

5G の出現は AI 連合学習にどのような影響を与えるでしょうか?

第4回パラダイム NeurIPS 2020: ナレッジグラフ埋め込みの自動化

機械学習の再考: 人工知能はどのようにして「記憶を失う」ことを学ぶのか?

JavaScript による機械学習の例 10 選

エッジAIとは何ですか?

2月10日に職場復帰ラッシュが到来し、北京は「急速AI温度検出器」の配備を開始した。

推薦する

「新しいインフラ」に求められるAI人材のギャップをどう埋めるか

ジェネレーティブAIを管理する方法

中国の人工知能産業における4つの大きなトレンド

医療における人工知能：医師よりも正確

さらに混沌です！ソラになりすました実在の人物の動画がすでに存在し、ウィル・スミスがパスタを食べながらミームを演じる

大規模言語モデルに基づくインテリジェントエージェントのモデリングとシミュレーション：レビューと展望

Amazon Translateについて

壁を登る毛虫のように、上海交通大学の新しいソフトロボットは水平にも垂直にも動くことができる

研究によると、2027年までにAIの電力消費量は一部の国の電力消費量と同等になると予想されている。

機械学習感情分析ツールのトップ 5 (スタートアップ)

AI はあらゆる人間の声を再現できます。これはポッドキャストにとって何を意味するのでしょうか?

2024年のトレンド: 時系列データと人工知能の融合アプリケーション

人工知能が台頭しています。インテリジェントセキュリティの開発はどのように進んでいますか?