機械学習は創造的な仕事に役立つ

機械学習は創造的な仕事に役立つ

【51CTO.com クイック翻訳】

[[397384]]

[序文]直感に反するように聞こえるかもしれませんが、創造に関して言えば、次の進化の原動力は機械から来るかもしれません。人工知能の進歩のおかげで、新しい種類のクリエイティブツールが市場に登場し始めています。コンテンツの作成が容易になるだけでなく、クリエイティブなプロセス自体の摩擦も取り除かれます。しかし、これらのツールは人間の天才に完全に取って代わることができるのでしょうか?合成コンテンツは本物のコンテンツと競合できるでしょうか?最新のクラブハウス チャンネル「Mosaic Patterns」(注: Clubhouse はオーディオ ソーシャル ソフトウェアで、Mosaic Patterns はチャンネル名です)では、Thomas Walser (TapeIt の創設者)、Victor Riparbelli (Synthesia の共同創設者)、Nathan Benaihi (Air Street Capital の創設者) とこのトピックについて話し合いました。

機械学習ツールがイノベーションのプロセスを変えている

クリエイティブツールには2つの種類があります。まず、コンテンツ制作を促進し、普及させることができるツールです。シンセサイザー、PS、ワードプロセッサなど、このタイプのツールには長い歴史があります。 2 つ目は、クリエイターの創造性を高めるためのツールです。このカテゴリのツールは、スマートフォンでの撮影など、より新しく興味深いものです。トーマスさんは、肉眼では捉えられず、認識することが難しいものがたくさんあると説明しました。 「シーンがどのようなものか、明るさはどの程度か、光のバランスはどうかを知ることで、創造性が高まり、集中力が高まります。」

イノベーションにおける手続き上の摩擦だけでなく、創造的な摩擦も軽減するのに役立つ、新世代の機械学習ツールが市場に登場しています。ビクター氏の見解では、次の10年は両者の融合によって定義されるだろう。ビデオ制作は、カメラや編集ソフトウェアを超えて、テキストの抽出、分析、要約、テキストの音声変換、30 秒の要約ビデオの作成などの機能にまで拡張されます。テンプレートやフィルター(Keynote、Instagram などで既に利用可能なものなど)を使用してクリエイティブな決定の一部を行い、機械知能を使用して効率化を図ります。

クリエイティブな「雑務」は目に見えなくなる

ベネディクト氏が指摘するように、「コンピューターは、自分で答えを見つけられるような質問をするべきではありません」。私たちは時間をかけて、どのプリンターを使うか、どこにファイルを保存するか、どのケーブルを使って接続するかといった質問を除外することに取り組んできました。これらの質問は複雑であり、不必要です。コンピュテーショナルフォトグラフィーも同じ軌跡をたどっています。 10年前のHDRボタンは、今ではスマートフォンのカメラで同じ効果を実現できます。つまり、5フレームを連続して撮影し、追加の操作なしで最適な1枚を自動的に保存します。

ベネディクト氏が「雑務」と呼ぶものを創造プロセスから取り除く、より創造的なツールが登場しています。機械学習により、音声から「えー」などの声や、ライブパフォーマンスの録音から咳などの声を除去できるようになりました。その開発の方向性としては、クリエイティブ ソフトウェア上の無数のボタンの設定をできるだけ避け、代わりに目標指向のクリエイティブ デザインのためのスマート テンプレートの形で登場させることです。

テクノロジーにより、新たなユースケース、ワークフロー、アイデアが実現します

ネイサンにとって、最も有望なイノベーションとは、テクノロジーそのものにあまり重点を置かず、ユーザーの問題と潜在的な解決策をより総合的に捉えたイノベーションです。クールなデモから始めて、それを誰に販売するかを真剣に考えるような創業者よりも、需要を示すために「創造的な問題に深く関わっており、機械知能を素早くパッケージ化する方法を知っている」創業者が好まれます。

これはよくある間違いです。合成メディア企業は、製品に重点を置きすぎて、ユーザーがあまり気にしないツールを構築してしまうことがよくあります。 「テクノロジーは、既存のポッドキャスト編集アプリケーションに組み込むのではなく、新しいワークフローを作成するためのツールであるべきです」とビクター氏は説明します。「機械学習は、メディア コンテンツを制作するまったく新しい方法を提供します。それがとてもエキサイティングな理由です。 Synthesia(Victor の会社)は、ビデオ制作をより簡単に、より速く行うことを目指してスタートしましたが、すぐに間違ったことに焦点を当てていることに気付きました。ビデオと比較して、必要なのは、テキスト コンテンツを作成し、ビデオを作成したことがない人々をより多く巻き込み、このグループの人々の可能性を解き放ち、より豊かな創造的体験を提供することです。

クリエイティブツールの置き換え:スマートフォンがデジタルカメラに取って代わったように

現在開発されているツールの多くは、まったく新しいタイプのメディアやコンテンツ体験に進化する可能性があります。次世代のビデオおよびオーディオ ツールは、新しい機能を追加するだけでなく、まったく異なる方法でコンテンツを作成します。

トーマス氏は、スマートフォンがデジタルカメラに取って代わったのと同じように、それらが今日のテクノロジーに取って代わると予想している。 「10 年前、デジタル カメラは大流行しました。しかし、今では衰退しつつあります。」それは、今日の音楽制作における多くのクリエイティブ ツールと同様に、デジタル カメラがユーザー エクスペリエンスを複雑にしているからです。オーディオを録音する場合、ミュージシャンはインターフェイス、マイク、マイクスタンド、ケーブル、ソフトウェアなどを必要としますが、彼らが本当にやりたいのはピアノを演奏することだけです。大きな革命は、不要な要素を排除し、他のクリエイティブモードをスマートフォンで写真を撮るのと同じくらい簡単にすることです。

ベネディクトも同意する。 1970 年代のカメラからデジタル カメラ、一眼レフ、そしてスマートフォンに至るまで、クリエイティブ ツールに期待できることは「すべてがソフトウェアになる」ということです。

テクノロジーは天才に取って代わるものではなく、天才を解放するもの

しかし、だからといって、私たちが使い慣れたハードウェア ツールで作成された「本物の」オーディオやビデオに別れを告げられるわけではありません。

機械学習が人間の才能に取って代わると考えるのは間違いです。機械学習は単に、創造プロセスの退屈な部分、つまり摩擦を生み出す細かい決定をすべて取り除くだけです。スマート ツールを使用すると、プロセスを抽象化できるため、クリエイターは実行の複雑さに悩まされることなく、アイデアをシームレスに実現できます。

ビクター氏によると、究極のビジョンはノートパソコンでハリウッド映画を作ることだという。コードがカメラに代わる合成メディアは、ビデオ技術の次の進化です。ソフトウェアになれば、無限に拡張可能で、アクセスしやすく、モジュールのコストもかかりません。つまり、クリエイターは私たちがまだ聞いたこともないような「あらゆる種類の奇妙で素晴らしいこと」を行うことができるのです。

最終的には、これらは既存のコンテンツに代わるものではなく、新しいタイプのコンテンツになります。それはクリエイターと消費者の選択です。仮想モデルを作ることは、実際のモデルよりも優れているかどうかはわかりませんが、それは重要ではありません。 「ドラムマシンはドラムのような音ではありませんが、それでも素晴らしい音です」とネイサンは指摘します。新しいクリエイティブツールの価値は、古いものを改良するだけでなく、新しいものを作るのに役立つことです。

オリジナルリンク:

https://www.mosaicventures.com/patterns/machine-learning-meets-creative-content-how-new-tools-are-taking-the-drag-out-of-creativity-and-inventing-new-genres?utm_campaign=Artificial%2BIntelligence%2BWeekly&utm_medium=email&utm_source=Artificial_Intelligence_Weekly_208

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  DNAロボットの進化!わずか数分で複雑なナノ構造のデバイスが作成され、体内に入り、タスクを実行します。

>>:  自動運転の 3 つの大きな問題点、つまり安全性に直接対処しますか?プレミアム?プライバシー漏洩?

ブログ    
ブログ    
ブログ    

推薦する

ISPの廃止はテスラの「純粋なビジョン路線」にとって重要なステップ

私はテスラの「純粋なビジュアルルート」に常に懐疑的でした。疑問なのは、アルゴリズムの進歩によってカメ...

選択できるアルゴリズムが多すぎますか?適切な機械学習アルゴリズムを選択する方法

機械学習は科学であると同時に芸術でもあります。さまざまな機械学習アルゴリズムを見ると、普遍的な解決策...

...

さまざまな専門家が独自のカスタムGPTを提供しました。24時間のトップ9リストはこちらです。

11月10日の早朝、OpenAIはGPTをリリースしました。ChatGPT Plusのすべての加入...

人工知能チュートリアル(IV):確率論入門

このシリーズの前回の記事では、行列と線形代数についてさらに詳しく説明し、JupyterLab を使用...

Dropbox のエンジニアがロスレス圧縮アルゴリズム「Pied Piper」を開発

Dropbox のエンジニアたちは世界をより良い場所にするために取り組んでおり、HBO のコメディー...

クラウドプラットフォームにおける人工知能の応用は2020年に爆発的な成長を示すだろう

アクセンチュアのアナリストは、2020 年に企業がより多くのイノベーションを獲得するのはクラウド プ...

大量データのための2次パーソナルコネクションマイニングアルゴリズム(Hadoop実装)

私は最近、Sina Weibo の「あなたに興味があるかもしれない人々」の間接的なフォローアップ推奨...

自動運転タクシーの分野では競争が激しく、中国では百度がリードしています。

タクシーサービスに代表される商業的探究の激化に伴い、自動運転タクシーの急速な導入は、自動運転が人々の...

生体認証に関する最大の誤解は何ですか?

セキュリティ分野で広く使用されている技術の中で、生体認証技術のプライバシー問題が最も懸念されています...

...

建物内の生体認証システム

新しい建物では、利用可能なリソースの最適化を最大限にしながら、セキュリティと有用かつ重要なデータを豊...

「ウイルス」ではなく「情報」を広めよう!プログラマーがAIを使って「手を洗う」を500以上の言語に翻訳

[[321195]]ビッグデータダイジェスト制作ダニエル・ホワイトナック編集者: lin、Cao P...

AIアラインメントを説明する4万語:北京大学と複数の大学チームがアラインメントの包括的なレビューを発表

論文(継続的に更新):arxiv.org/abs/2310.19852 AI アライメント概要ウェブ...

AIとビッグデータのつながり

ビッグデータと人工知能は、今日最も新しく、最も有用なテクノロジーの 2 つです。人工知能は10年以上...