機械学習は創造的な仕事に役立つ

機械学習は創造的な仕事に役立つ

【51CTO.com クイック翻訳】

[[397384]]

[序文]直感に反するように聞こえるかもしれませんが、創造に関して言えば、次の進化の原動力は機械から来るかもしれません。人工知能の進歩のおかげで、新しい種類のクリエイティブツールが市場に登場し始めています。コンテンツの作成が容易になるだけでなく、クリエイティブなプロセス自体の摩擦も取り除かれます。しかし、これらのツールは人間の天才に完全に取って代わることができるのでしょうか?合成コンテンツは本物のコンテンツと競合できるでしょうか?最新のクラブハウス チャンネル「Mosaic Patterns」(注: Clubhouse はオーディオ ソーシャル ソフトウェアで、Mosaic Patterns はチャンネル名です)では、Thomas Walser (TapeIt の創設者)、Victor Riparbelli (Synthesia の共同創設者)、Nathan Benaihi (Air Street Capital の創設者) とこのトピックについて話し合いました。

機械学習ツールがイノベーションのプロセスを変えている

クリエイティブツールには2つの種類があります。まず、コンテンツ制作を促進し、普及させることができるツールです。シンセサイザー、PS、ワードプロセッサなど、このタイプのツールには長い歴史があります。 2 つ目は、クリエイターの創造性を高めるためのツールです。このカテゴリのツールは、スマートフォンでの撮影など、より新しく興味深いものです。トーマスさんは、肉眼では捉えられず、認識することが難しいものがたくさんあると説明しました。 「シーンがどのようなものか、明るさはどの程度か、光のバランスはどうかを知ることで、創造性が高まり、集中力が高まります。」

イノベーションにおける手続き上の摩擦だけでなく、創造的な摩擦も軽減するのに役立つ、新世代の機械学習ツールが市場に登場しています。ビクター氏の見解では、次の10年は両者の融合によって定義されるだろう。ビデオ制作は、カメラや編集ソフトウェアを超えて、テキストの抽出、分析、要約、テキストの音声変換、30 秒の要約ビデオの作成などの機能にまで拡張されます。テンプレートやフィルター(Keynote、Instagram などで既に利用可能なものなど)を使用してクリエイティブな決定の一部を行い、機械知能を使用して効率化を図ります。

クリエイティブな「雑務」は目に見えなくなる

ベネディクト氏が指摘するように、「コンピューターは、自分で答えを見つけられるような質問をするべきではありません」。私たちは時間をかけて、どのプリンターを使うか、どこにファイルを保存するか、どのケーブルを使って接続するかといった質問を除外することに取り組んできました。これらの質問は複雑であり、不必要です。コンピュテーショナルフォトグラフィーも同じ軌跡をたどっています。 10年前のHDRボタンは、今ではスマートフォンのカメラで同じ効果を実現できます。つまり、5フレームを連続して撮影し、追加の操作なしで最適な1枚を自動的に保存します。

ベネディクト氏が「雑務」と呼ぶものを創造プロセスから取り除く、より創造的なツールが登場しています。機械学習により、音声から「えー」などの声や、ライブパフォーマンスの録音から咳などの声を除去できるようになりました。その開発の方向性としては、クリエイティブ ソフトウェア上の無数のボタンの設定をできるだけ避け、代わりに目標指向のクリエイティブ デザインのためのスマート テンプレートの形で登場させることです。

テクノロジーにより、新たなユースケース、ワークフロー、アイデアが実現します

ネイサンにとって、最も有望なイノベーションとは、テクノロジーそのものにあまり重点を置かず、ユーザーの問題と潜在的な解決策をより総合的に捉えたイノベーションです。クールなデモから始めて、それを誰に販売するかを真剣に考えるような創業者よりも、需要を示すために「創造的な問題に深く関わっており、機械知能を素早くパッケージ化する方法を知っている」創業者が好まれます。

これはよくある間違いです。合成メディア企業は、製品に重点を置きすぎて、ユーザーがあまり気にしないツールを構築してしまうことがよくあります。 「テクノロジーは、既存のポッドキャスト編集アプリケーションに組み込むのではなく、新しいワークフローを作成するためのツールであるべきです」とビクター氏は説明します。「機械学習は、メディア コンテンツを制作するまったく新しい方法を提供します。それがとてもエキサイティングな理由です。 Synthesia(Victor の会社)は、ビデオ制作をより簡単に、より速く行うことを目指してスタートしましたが、すぐに間違ったことに焦点を当てていることに気付きました。ビデオと比較して、必要なのは、テキスト コンテンツを作成し、ビデオを作成したことがない人々をより多く巻き込み、このグループの人々の可能性を解き放ち、より豊かな創造的体験を提供することです。

クリエイティブツールの置き換え:スマートフォンがデジタルカメラに取って代わったように

現在開発されているツールの多くは、まったく新しいタイプのメディアやコンテンツ体験に進化する可能性があります。次世代のビデオおよびオーディオ ツールは、新しい機能を追加するだけでなく、まったく異なる方法でコンテンツを作成します。

トーマス氏は、スマートフォンがデジタルカメラに取って代わったのと同じように、それらが今日のテクノロジーに取って代わると予想している。 「10 年前、デジタル カメラは大流行しました。しかし、今では衰退しつつあります。」それは、今日の音楽制作における多くのクリエイティブ ツールと同様に、デジタル カメラがユーザー エクスペリエンスを複雑にしているからです。オーディオを録音する場合、ミュージシャンはインターフェイス、マイク、マイクスタンド、ケーブル、ソフトウェアなどを必要としますが、彼らが本当にやりたいのはピアノを演奏することだけです。大きな革命は、不要な要素を排除し、他のクリエイティブモードをスマートフォンで写真を撮るのと同じくらい簡単にすることです。

ベネディクトも同意する。 1970 年代のカメラからデジタル カメラ、一眼レフ、そしてスマートフォンに至るまで、クリエイティブ ツールに期待できることは「すべてがソフトウェアになる」ということです。

テクノロジーは天才に取って代わるものではなく、天才を解放するもの

しかし、だからといって、私たちが使い慣れたハードウェア ツールで作成された「本物の」オーディオやビデオに別れを告げられるわけではありません。

機械学習が人間の才能に取って代わると考えるのは間違いです。機械学習は単に、創造プロセスの退屈な部分、つまり摩擦を生み出す細かい決定をすべて取り除くだけです。スマート ツールを使用すると、プロセスを抽象化できるため、クリエイターは実行の複雑さに悩まされることなく、アイデアをシームレスに実現できます。

ビクター氏によると、究極のビジョンはノートパソコンでハリウッド映画を作ることだという。コードがカメラに代わる合成メディアは、ビデオ技術の次の進化です。ソフトウェアになれば、無限に拡張可能で、アクセスしやすく、モジュールのコストもかかりません。つまり、クリエイターは私たちがまだ聞いたこともないような「あらゆる種類の奇妙で素晴らしいこと」を行うことができるのです。

最終的には、これらは既存のコンテンツに代わるものではなく、新しいタイプのコンテンツになります。それはクリエイターと消費者の選択です。仮想モデルを作ることは、実際のモデルよりも優れているかどうかはわかりませんが、それは重要ではありません。 「ドラムマシンはドラムのような音ではありませんが、それでも素晴らしい音です」とネイサンは指摘します。新しいクリエイティブツールの価値は、古いものを改良するだけでなく、新しいものを作るのに役立つことです。

オリジナルリンク:

https://www.mosaicventures.com/patterns/machine-learning-meets-creative-content-how-new-tools-are-taking-the-drag-out-of-creativity-and-inventing-new-genres?utm_campaign=Artificial%2BIntelligence%2BWeekly&utm_medium=email&utm_source=Artificial_Intelligence_Weekly_208

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  DNAロボットの進化!わずか数分で複雑なナノ構造のデバイスが作成され、体内に入り、タスクを実行します。

>>:  自動運転の 3 つの大きな問題点、つまり安全性に直接対処しますか?プレミアム?プライバシー漏洩?

ブログ    

推薦する

専門家:TikTokのアルゴリズムはユニークではないが、購入者はそれを自ら開発することを待ちきれない

2018年にバイトダンスがカラオケアプリ「Musical.ly」を買収し、TikTokとしてブランド...

Javaは4つのWeChat赤い封筒をつかむアルゴリズムを実装し、感謝せずにそれを受け取ります

概要2014年にWeChatが紅包機能を開始した後、多くの企業が独自の紅包機能の開発を開始しました。...

AI受験者が発狂!上級数学試験の正解率は81%で、競争試験のスコアはコンピュータドクターのスコアよりも高い。

上級数学の試験で悪い成績を取ることは、多くの人にとって悪夢です。高度な数学は AI ほど得意ではない...

...

...

転移学習とクロスドメイン推奨、およびクロスドメイン推奨のソリューション

この記事では、主にクロスドメインの推奨事項について詳しく紹介します。内容は以下のとおりですが、これら...

人工知能:未来への道を切り開く

[51CTO.com クイック翻訳]デジタル経済が世界を席巻する中、人工知能は今日私たちが知っている...

GPTストアはオンラインになるとすぐに混乱に陥り、偽造品、偽のトラフィック、禁止されたコンテンツが次々と出現します

新しくオープンしたGPTストアが「混沌」していることで有名になるとは思ってもいませんでした。見てくだ...

メタ、マイクロソフトなどの大手企業は、AIモデルの訓練に海賊版書籍を使用したとして、数人のアメリカ人作家から訴えられた。

現地時間水曜日のブルームバーグの報道によると、数人のアメリカ人作家が最近ニューヨーク連邦裁判所に訴訟...

複数人の3D姿勢を正確かつ効率的に推定、Meitu Beihang分散知覚シングルステージモデルがCVPRに採用

最近、トップコンピュータビジョンカンファレンスCVPR 2022がカンファレンスの参加結果を発表し、...

...

IoT、AI、ビッグデータが地球を救う方法

私たちは皆、モノのインターネット (IoT)、人工知能 (AI)、ビッグデータが業界の再編とビジネス...

OpenAIが安全チームを設置 準備: AIのリスクを評価し、外部からの悪用を防ぐ

OpenAIは10月27日、汎用人工知能(AGI)によって引き起こされる可能性のある壊滅的なリスクを...

Apriori アルゴリズムの紹介 (Python 実装)

[[188839]]ビッグデータの概念が普及するにつれ、ビールとおむつの話は広く知られるようになり...