機械学習は創造的な仕事に役立つ

機械学習は創造的な仕事に役立つ

【51CTO.com クイック翻訳】

[[397384]]

[序文]直感に反するように聞こえるかもしれませんが、創造に関して言えば、次の進化の原動力は機械から来るかもしれません。人工知能の進歩のおかげで、新しい種類のクリエイティブツールが市場に登場し始めています。コンテンツの作成が容易になるだけでなく、クリエイティブなプロセス自体の摩擦も取り除かれます。しかし、これらのツールは人間の天才に完全に取って代わることができるのでしょうか?合成コンテンツは本物のコンテンツと競合できるでしょうか?最新のクラブハウス チャンネル「Mosaic Patterns」(注: Clubhouse はオーディオ ソーシャル ソフトウェアで、Mosaic Patterns はチャンネル名です)では、Thomas Walser (TapeIt の創設者)、Victor Riparbelli (Synthesia の共同創設者)、Nathan Benaihi (Air Street Capital の創設者) とこのトピックについて話し合いました。

機械学習ツールがイノベーションのプロセスを変えている

クリエイティブツールには2つの種類があります。まず、コンテンツ制作を促進し、普及させることができるツールです。シンセサイザー、PS、ワードプロセッサなど、このタイプのツールには長い歴史があります。 2 つ目は、クリエイターの創造性を高めるためのツールです。このカテゴリのツールは、スマートフォンでの撮影など、より新しく興味深いものです。トーマスさんは、肉眼では捉えられず、認識することが難しいものがたくさんあると説明しました。 「シーンがどのようなものか、明るさはどの程度か、光のバランスはどうかを知ることで、創造性が高まり、集中力が高まります。」

イノベーションにおける手続き上の摩擦だけでなく、創造的な摩擦も軽減するのに役立つ、新世代の機械学習ツールが市場に登場しています。ビクター氏の見解では、次の10年は両者の融合によって定義されるだろう。ビデオ制作は、カメラや編集ソフトウェアを超えて、テキストの抽出、分析、要約、テキストの音声変換、30 秒の要約ビデオの作成などの機能にまで拡張されます。テンプレートやフィルター(Keynote、Instagram などで既に利用可能なものなど)を使用してクリエイティブな決定の一部を行い、機械知能を使用して効率化を図ります。

クリエイティブな「雑務」は目に見えなくなる

ベネディクト氏が指摘するように、「コンピューターは、自分で答えを見つけられるような質問をするべきではありません」。私たちは時間をかけて、どのプリンターを使うか、どこにファイルを保存するか、どのケーブルを使って接続するかといった質問を除外することに取り組んできました。これらの質問は複雑であり、不必要です。コンピュテーショナルフォトグラフィーも同じ軌跡をたどっています。 10年前のHDRボタンは、今ではスマートフォンのカメラで同じ効果を実現できます。つまり、5フレームを連続して撮影し、追加の操作なしで最適な1枚を自動的に保存します。

ベネディクト氏が「雑務」と呼ぶものを創造プロセスから取り除く、より創造的なツールが登場しています。機械学習により、音声から「えー」などの声や、ライブパフォーマンスの録音から咳などの声を除去できるようになりました。その開発の方向性としては、クリエイティブ ソフトウェア上の無数のボタンの設定をできるだけ避け、代わりに目標指向のクリエイティブ デザインのためのスマート テンプレートの形で登場させることです。

テクノロジーにより、新たなユースケース、ワークフロー、アイデアが実現します

ネイサンにとって、最も有望なイノベーションとは、テクノロジーそのものにあまり重点を置かず、ユーザーの問題と潜在的な解決策をより総合的に捉えたイノベーションです。クールなデモから始めて、それを誰に販売するかを真剣に考えるような創業者よりも、需要を示すために「創造的な問題に深く関わっており、機械知能を素早くパッケージ化する方法を知っている」創業者が好まれます。

これはよくある間違いです。合成メディア企業は、製品に重点を置きすぎて、ユーザーがあまり気にしないツールを構築してしまうことがよくあります。 「テクノロジーは、既存のポッドキャスト編集アプリケーションに組み込むのではなく、新しいワークフローを作成するためのツールであるべきです」とビクター氏は説明します。「機械学習は、メディア コンテンツを制作するまったく新しい方法を提供します。それがとてもエキサイティングな理由です。 Synthesia(Victor の会社)は、ビデオ制作をより簡単に、より速く行うことを目指してスタートしましたが、すぐに間違ったことに焦点を当てていることに気付きました。ビデオと比較して、必要なのは、テキスト コンテンツを作成し、ビデオを作成したことがない人々をより多く巻き込み、このグループの人々の可能性を解き放ち、より豊かな創造的体験を提供することです。

クリエイティブツールの置き換え:スマートフォンがデジタルカメラに取って代わったように

現在開発されているツールの多くは、まったく新しいタイプのメディアやコンテンツ体験に進化する可能性があります。次世代のビデオおよびオーディオ ツールは、新しい機能を追加するだけでなく、まったく異なる方法でコンテンツを作成します。

トーマス氏は、スマートフォンがデジタルカメラに取って代わったのと同じように、それらが今日のテクノロジーに取って代わると予想している。 「10 年前、デジタル カメラは大流行しました。しかし、今では衰退しつつあります。」それは、今日の音楽制作における多くのクリエイティブ ツールと同様に、デジタル カメラがユーザー エクスペリエンスを複雑にしているからです。オーディオを録音する場合、ミュージシャンはインターフェイス、マイク、マイクスタンド、ケーブル、ソフトウェアなどを必要としますが、彼らが本当にやりたいのはピアノを演奏することだけです。大きな革命は、不要な要素を排除し、他のクリエイティブモードをスマートフォンで写真を撮るのと同じくらい簡単にすることです。

ベネディクトも同意する。 1970 年代のカメラからデジタル カメラ、一眼レフ、そしてスマートフォンに至るまで、クリエイティブ ツールに期待できることは「すべてがソフトウェアになる」ということです。

テクノロジーは天才に取って代わるものではなく、天才を解放するもの

しかし、だからといって、私たちが使い慣れたハードウェア ツールで作成された「本物の」オーディオやビデオに別れを告げられるわけではありません。

機械学習が人間の才能に取って代わると考えるのは間違いです。機械学習は単に、創造プロセスの退屈な部分、つまり摩擦を生み出す細かい決定をすべて取り除くだけです。スマート ツールを使用すると、プロセスを抽象化できるため、クリエイターは実行の複雑さに悩まされることなく、アイデアをシームレスに実現できます。

ビクター氏によると、究極のビジョンはノートパソコンでハリウッド映画を作ることだという。コードがカメラに代わる合成メディアは、ビデオ技術の次の進化です。ソフトウェアになれば、無限に拡張可能で、アクセスしやすく、モジュールのコストもかかりません。つまり、クリエイターは私たちがまだ聞いたこともないような「あらゆる種類の奇妙で素晴らしいこと」を行うことができるのです。

最終的には、これらは既存のコンテンツに代わるものではなく、新しいタイプのコンテンツになります。それはクリエイターと消費者の選択です。仮想モデルを作ることは、実際のモデルよりも優れているかどうかはわかりませんが、それは重要ではありません。 「ドラムマシンはドラムのような音ではありませんが、それでも素晴らしい音です」とネイサンは指摘します。新しいクリエイティブツールの価値は、古いものを改良するだけでなく、新しいものを作るのに役立つことです。

オリジナルリンク:

https://www.mosaicventures.com/patterns/machine-learning-meets-creative-content-how-new-tools-are-taking-the-drag-out-of-creativity-and-inventing-new-genres?utm_campaign=Artificial%2BIntelligence%2BWeekly&utm_medium=email&utm_source=Artificial_Intelligence_Weekly_208

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  DNAロボットの進化!わずか数分で複雑なナノ構造のデバイスが作成され、体内に入り、タスクを実行します。

>>:  自動運転の 3 つの大きな問題点、つまり安全性に直接対処しますか?プレミアム?プライバシー漏洩?

ブログ    

推薦する

...

...

Google、AIコードエディタIDXをリリース:クラウド仮想マシンで開発環境の構成を簡素化

Googleは8月9日、「Project IDX」プロジェクトを公開し、AI技術を統合したコードエデ...

...

6つの主要なソートアルゴリズム

6 つの一般的なソート アルゴリズムの GIF アニメーションがあり、ソートの考え方をより簡単に理解...

表の数学的推論の正解率は98.78%です! UCLA が新しい「カメレオン推論フレームワーク」を発表

自然言語処理タスクで目覚ましい成功を収めた大規模言語モデル (LLM) は、優れたパフォーマンスを示...

ベイズ最適化の美しさ: 素晴らしいアルゴリズムの背後にある直感

[[345174]]計算コストが高く、必ずしも解析的な表現ではなく、導関数が不明な関数 f(x) が...

2030年までに、人工知能のせいで世界中で8億人が失業するでしょう!ビル・ゲイツの失業者へのアドバイス

[[219257]]人工知能は本質的には人間のシミュレーションです。人間の思考をシミュレートする方法...

Microsoft Flight SimulatorはAIを使って15億の建物を復元、宮殿がオフィスビルに変わる際にバグが発生

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

百度副社長の尹世明氏:人工知能のプライバシー問題は技術で解決できる

[[260878]] 「当社は、個人データへのアクセスを必要としないマルチパーティデータコンピューテ...

...

TensorFlow ワイド&ディープラーニングチュートリアル

[[211918]]この記事では、TF.Learn API を使用して、ワイド線形モデルとディープ ...

アリの採餌とインターネットアルゴリズム

[[93484]]人間とアリの違いは何でしょうか? Ant にはインターネットがありません。創造的な...