YouTube、有名歌手の真似をしたり、テキストやハミングで曲を作曲できるAIツールをリリース

YouTube、有名歌手の真似をしたり、テキストやハミングで曲を作曲できるAIツールをリリース

YouTube は 11 月 16 日に、ユーザーがテキストを入力したりメロディーをハミングしたりすることで音楽を作成できる新しい生成 AI 機能をテストしています。 「ドリームトラック」と呼ばれる機能の1つは、すでにプラットフォーム上の一部のクリエイターに提供されており、有名アーティストのスタイルに基づいて30秒のミュージッククリップを自動的に生成します。この機能は 9 人の異なるアーティストの真似をすることができ、YouTube はこれらのアーティスト全員と連携して機能を開発しました。 YouTube は、ハミングで音楽を​​生成できる新しいツールもいくつか披露しました。

YouTubeは現在、アレック・ベンジャミン、チャーリー・プース、チャーリー・エックスシーエックス、デミ・ロヴァート、ジョン・レジェンド、パプース、シーア、Tペイン、トロイ・シヴァンの9人のアーティストのスタイルで音楽を制作するため、「少数の選ばれた米国のクリエイター」とドリームトラック機能をテスト中だと述べている。公式ビデオのデモンストレーションでは、「正反対のものが惹かれ合うフォークバラード、アップビートなアコースティックソング」などのプロンプトを使用してチャーリー・プース風の音楽を作成する方法や、「フロリダの晴れた朝、R&B」などのプロンプトを使用して T-ペイン風の音楽を作成する方法が紹介されています。このソフトウェアは、アーティストのスタイルに合わせて歌詞、伴奏、AI合成音声を生成できる。

IT Home は、YouTube が Dream Track に加えて、ユーザーが従来の楽器を使わずに音楽を作成できるように設計された他の音楽 AI ツールもいくつか紹介していることに気付きました。 YouTube のデモ動画では、ハミングしたメロディーと「サックス ソロ」などのテキスト プロンプトを組み合わせてサックス用の楽曲を作成する方法が紹介されています。ビートボックスをドラムループに変換したり、歌をオーケストラ曲に変換したり、MIDI キーボードのコードから合唱団を作成したりする方法を紹介するビデオもあります。

YouTubeは、ミュージックAIインキュベーターの参加者が今年後半にツールをテストできるようになると述べた。

新しい AI ツールは、Google の DeepMind が開発した音楽生成モデル Lyria を搭載しています。 DeepMind はブログ投稿で、Lyria を使用して生成された音楽には人間の耳には聞こえない SynthID 透かしが含まれ、音楽が変更されても保持されると述べています。そのため、たとえ誰かが音楽にノイズを追加したり、MP3 ファイルに圧縮したり、再生速度を上げたりしたとしても、理論的には Lyria の AI 生成オーディオが含まれていると識別される可能性があります。

数日前、YouTube は今後数か月以内に AI による音楽カバーやキャラクターを模倣した AI 生成コンテンツを削除すると発表したことは注目に値します。

<<:  マイクロソフトの新特許公開:機械学習で「赤面」するリアルなアバターを作成

>>:  韓国中央銀行が警告:AIが国内で400万の雇用を奪う可能性

推薦する

機械学習モデルのトレーニングの全プロセス!

週末に家で退屈していたので、GitHub を閲覧していたところ、非常に興味深いオープンソース プロジ...

「Singularity」AIコンピューティングプラットフォームの詳細を公開!それは4年前のマイクロソフトの古いプロジェクトの復活であることが判明した

AI サービス プラットフォームのコストと効率の問題は、大手サービス プロバイダーが解決と改善に懸命...

AIはワクチン業界に何をもたらすのでしょうか?

[[237673]]画像出典: Visual Chinaワクチンは良いビジネスなのか、それとも生命...

OpenAIの謎の新モデルQ*が暴露された。取締役会に警告するにはあまりにも強力だったため、ウルトラマン解任の導火線になるかもしれない

OpenAI 宮殿ドラマが終わったばかりですが、すぐにまた別の騒動が勃発しました。ロイター通信は、ア...

警察ドローンの数十億ドル規模のブルーオーシャンをどう実現するか?今後はこの3点に注目してください!

近年、飛行制御、ナビゲーション、通信などの技術の継続的な発展に伴い、ドローン産業は急速な成長を遂げて...

...

...

マイクロソフトCEO、テクノロジー大手各社がAIを訓練するためのコンテンツをめぐって競争していると語る

ナデラ氏は最近、米国政府によるグーグルに対する反トラスト訴訟で証言した。これは、米国政府が1998年...

face_recognitionに基づく顔認識の実装

前回の記事では、写真に写っている顔を検出し、顔の特徴(鼻、目、眉毛など)をマークしました。この記事で...

これら 19 の主流 AI テクノロジーについて、どの企業がサービスを提供しているかご存知ですか?

[51CTO.com クイック翻訳] 自然言語生成や音声認識などの分野を中心に、現在主流となってい...

...

...

...

...

コーディング能力はGPT-4を超え、このモデルはBig Codeランキングでトップとなり、YC創設者も賞賛している

GPT-4を上回るコーディング能力を持つと主張するモデルが、多くのネットユーザーの注目を集めている。...