韓国の新人歌手ハヨンが10月8日、人工知能作曲ロボットEvoMがプロデュースしたシングル「Eyes on you」を発売し、AI作曲でデビューする世界初の人間歌手となった。 EvoMは、韓国の光州科学技術院人工知能大学院が開発した韓国初の人工知能作曲ロボット。「Eyes on you」のレコーディングにおける楽曲の作曲と編曲を担当した。 EvoMの開発者アン・チャンウク氏は、AIが作成した曲をK-POPチャートに載せることが目標だと語った。 Qihang - 音楽制作の自動化への野望 人類は、前世紀の初めから、コンピューターが独自に音楽を制作する可能性を模索し始めました。 1956年、レヤレン・ヒラーの研究室で、世界初の完全にコンピューターで生成された音楽作品、弦楽四重奏曲「イリアック組曲」が誕生しました。 1995年にアルパーンが開発したEMI作曲システムも、初期の成熟したクラシック音楽作曲システムでした。このシステムは主にスプライシング方式を使用して、バッハのようなインヴェンション、器楽協奏曲や組曲、モーツァルトのようなソナタ、ショパンのような夜想曲など、亡くなった作曲家の音楽スタイルを再現した作品を作成しました。 近年、人工知能関連技術の発展と普及に伴い、テクノロジーと芸術を融合したこの素晴らしい分野を研究する企業や機関が増えています。さまざまな作曲アルゴリズムが登場し、多くのバーチャルミュージシャンが登場しています。 「スマート相対理論」を整理すると次のようになります。 2016年、Googleが開発した機械学習プロジェクトであるMagenta studioは、ニューラル学習ネットワークを通じて90秒のピアノ曲を制作しました。同年、ソニーのコンピュータサイエンス研究所(ソニーCSL)はFlow Machinesプラットフォームを開発しました。 Flow Machinesは、マルコフ連鎖を用いてデータベース内の既存曲を分析し、メロディーやコードに関するキー情報を抽出し、このキー情報を変数として音楽スタイルを学習することで、異なるスタイルの曲を変換、統合、最適化することができます。代表作はビートルズ風の「Daddy's Car」です。さらにソニーCSLは「DeepBach」と呼ばれるニューラルネットワークも開発し、バッハ作曲の352曲を使ってDeepBachをトレーニングし、最終的に2,503曲の賛美歌の作成を完了した。 正式に世界的地位を獲得した最初の AI バーチャル作曲家は、2016 年に誕生した AIVA (Artificial Intelligence Virtual Artist) です。 AIVAは、モーツァルト、バッハ、ベートーベンなど著名な作曲家が作曲した15,000曲の楽曲を読み込んで学習します。ディープラーニング技術を用いて独自の音楽理解を反映した数学モデルを構築し、そのモデルを使って完全にオリジナルの音楽を生み出します。 AIVA はバーチャルミュージシャンとして、フランス・ルクセンブルク作曲家協会 (SACEM) に法的に登録されており、協会初の人間以外の会員となり、独自の著作権を有しています。 今年2月、アメリカのデジタル研究組織Space150は、有名ラッパーのトラヴィス・スコットのボーカルと音楽スタイルを模倣し、トラヴィス・ボットという名のラップロボットを作成した。 これは人工知能の創造性に関する実験です。研究開発チームは、ニューラルネットワーク技術を追加して「トラヴィス・スコット風味」のメロディーとパーカッションの伴奏を作成し、トラヴィス・スコットの歌詞を「テキスト生成モデル」に入力して、機械がトラヴィス風に自動生成した歌詞を取得しました。 こうして、トラヴィス・ボットは彼自身の作品「ジャック・パーク・カニー・ドープ・マン」を完成させた。最終的に、R&DチームはAIベースの人物画像合成技術「ディープフェイク」を使用してこの曲のMVを撮影しました。音楽効果の面から見ると、トラヴィス・ボットのトラヴィス・スコットの模倣は本物とほとんど区別がつかず、トラヴィス・スコットの作品の最も重要な外部特性と個人の魅力を完全に融合しています。同時に、このプロジェクトでは人工ニューラルネットワーク技術(Artificial Neural Networks)の積極的な開発もさらに検証され、将来的に音楽におけるAIの応用価値の探求に役立つでしょう。 造船の原理 - いくつかのアルゴリズムモデル 現代の人工知能構成技術は、人工ニューラル ネットワーク、マルコフ連鎖、遺伝的アルゴリズムなど、複数のアルゴリズム モデルを組み合わせて適用したものです。たとえば、AIVA と Travis Bott は人工ニューラル ネットワークに基づくディープラーニング技術を使用しました。 人工ニューラルネットワークは、生物の神経のネットワーク動作特性を模倣し、分散並列情報処理を行うアルゴリズム的な数学モデルです。プログラマーは、さまざまな入力ポイントと出力ポイント間の情報を処理するために、多層の「ニューラル ネットワーク」を構築し、各層を個別にプログラムする必要があります。作品のデータが入力されると、人工ニューラルネットワークは多数の入力作品の中からパターンを見つけ出し、音楽のメロディー、リズム、ピッチ、強さの変化を理解し、学習します。 この種の学習の主な目的は、作品を生み出すことではなく、予測を行うことです。 AI プログラムは上記の音楽スタイルに対する予測を実行し続け、次の検証データセットに遭遇することになります。このデータセットによって予測が正しいかどうかが判断され、正しいフィードバックと誤ったフィードバックの両方が AI によって記憶されます。 継続的な高速学習により、AIの予測能力はますます強くなり、最終的にはプログラマーのビッグデータによってまとめられた音楽スタイルを習得し、独自の音楽を作曲するようになります。人工ニューラル ネットワークは、アルゴリズムを使用して音楽を作曲する新しい方法を提供します。その利点は、音楽作品の全体的な特徴を学習できることですが、トレーニングには大量のサンプルが必要です。作成された音楽の完全性を保証できる LSTM ニューラル ネットワークなど、このアルゴリズムに基づいた人工知能作曲システムは国内外に数多く存在します。 人工ニューラルネットワークに加えて、マルコフ連鎖はアルゴリズム構成の分野でも広く使用されています。マルコフ連鎖はランダム選択プロセスであり、主に特定のスタイルのメロディーを生成するために使用されます。それは、特定の基準に従って人工的に構築された変換表に従って音符を順番に選択し、次に出現する音符の確率を計算して選択するようなものです。この方法は、作曲家の作曲時の思考をシミュレートし、コンピューターを制御して対応する音楽作品を生成することができますが、作品全体の形式構造をマルコフ連鎖でモデル化することはできません。遺伝的アルゴリズムは、生物学的進化のプロセスを模倣し、適応度関数を使用してサンプルを進化させ、全体的な状況を最適化するインテリジェントな計算方法です。 その中で、突然変異オペレータは、人が創作するときに起こるひらめきをシミュレートすることができ、それは最も代表的な作品を残して新しいメロディーを生成することと同等です。このアルゴリズムの障壁は、適応度関数の設計に統一された標準が存在しないことです。 著作権の「暗礁」は、依然としてAI作曲が直面する主な問題である AI音楽はアルゴリズムモデルに基づいて制作されるため、コンピューターは大量の既成作品の中から「ルール」を探し、そのルールに従ってデータから特定の音楽断片を抽出し、計算された確率に従って並べ替えたり組み合わせたりすることが求められます。そのため、AI作曲には、データベース内の大量の既成作品の著作権問題が必然的に伴います。 AIは研究者が提供する音楽ライブラリのどの作品が著作権で保護されているかをどのように判断するのでしょうか?AI作曲の結果は学習対象の著作権を侵害しないのでしょうか?例えば、AIVAは当初、学習対象としてクラシック音楽を使用していました。使用したモーツァルトやベートーベンなどの作品は歴史が長く、著作権の期限が切れているため、そのような問題はありません。 AIVA の研究者は、主に著作権の問題を避けるために、意図的にクラシック音楽を研究対象として選びました。しかし、トラヴィス・ボットが使用するトラヴィス・スコットのキャラクターや作品に関する情報はすべて許可を得ている必要があります。では、トラヴィス・ボットがこれに基づいて作成した作品は、トラヴィス・スコットの盗作と見なされるのでしょうか?音楽作品の盗作問題は珍しくなく、関連する議論は今でも時々発生しますが、まだ統一された明確な判断基準はありません。著作権問題からもわかるように、現在の人工知能作曲技術はアルゴリズムに依存しており、音楽ライブラリの音楽「ルール」に制限されており、既存のルールを打ち破る作曲アイデアを生み出すことができません。これは、AI作曲が直面しているもう1つの技術的な困難です。 AI作曲技術が継続的に最適化され、最終的に著作権侵害のない純粋にオリジナルの作品が生み出されたとしても、これらの作品は依然として著作権認証の問題に直面することになる。 AI創作関連技術が成熟し普及するにつれ、一部の国ではAI作品の著作権の帰属を法律で明確に定義し始めています。 1988年、英国は1988年著作権、意匠及び特許法を正式に公布し、コンピュータ創作の内容を明確に規定した。「コンピュータによって生成された作品に必要な手続きを行った者は、コンピュータによって生成された作品の著作者とみなされ、保護期間は作品が完成した年の末日から50年で満了する。」 この法律は、AI著作物の著作権は「必要な手続きを行った者」に帰属すると規定しており、また、コンピューター生成著作物の「必要な手続きを行った者」には、プログラマー、ユーザー、さらには人工知能システムや機器への投資家も含まれると明確に定義しています。 2017年、世界知的所有権機関(WIPO)の雑誌は、作品が「人間の関与が限定的または全くない」状態で作成された場合、著作権法は2つの方法で効力を発揮する可能性があると言及しました。著作権法は、コンピューターで生成された作品に対する著作権保護を「否定」するか、そのような作品の著者をプログラムの作成者に帰属させる可能性があります。この種の問題に対する現在の国内の解決策は、基本的にこの考えに従っています。 2018年、上海の企業が、テンセントが開発した自動執筆プログラム「Dream Writer」によって生成された財務報告書を、許可なく同社のウェブサイトにコピーした。深セン市南山区裁判所は、同社がテンセントの著作権を侵害したことについて民事責任を負い、賠償金としてテンセントに1,500元を支払うよう命じる判決を下した。 中国の現行著作権法では、AI作品の著作権の帰属についてまだ明確に定義されていない。今回の判決は、AI創作の分野において重要な節目となるかもしれない。 「著作権法」:「著作権とは、著作権法によって民間団体に著作物および関連する物に対して付与される権利である。」このうち、民間団体とは、国民、法人または非法人団体を指します。著作権法の保護対象は、民事主体としての独創的なアイデアの表現である。民事主体ではないAIは、単独では著作権を享受できないが、人間の作曲者や開発者の名前を著作者リストに追加することで、この問題は解決できる。人工知能は法律で保護される対象にはなり得ないが、その著作物の著作権の保護は法律で認められ始めている。 感情のない補助装置 - 箱舟の方向 人工知能作曲技術の成熟化が進み、音楽業界に大きな波を起こしています。人工知能は、大量の楽譜を読み込んで記憶し、ルールを獲得し、音符のリズムの発生確率を計算し、それらをアレンジしたり組み合わせたりすることで、音楽を「創造」する能力を実現しています。しかし、音楽の核となるのは、音楽そのものではなく、「人」です。音楽は、人間の感情の流れから生まれます。 『礼記』における音楽の起源の説明は、非常に的確である。「すべての音は人間の心から生じる。人間の心の動きは物によって引き起こされる。物によって動かされ、音として表現される。音は互いに反応し、したがって変化する。そして、それが四角形に変化したとき、それは音楽と呼ばれる。」作曲家や演奏者がメロディーとリズムで表現した感情は、音楽を聴く聴衆と共鳴する。音符によって達成される、時間、空間、人種を超えた感情の交流こそが、音楽の存在意義であり、モーツァルトやベートーベンなどの音楽家が永遠に有名になった根本的な理由でもある。 ある観点から見ると、音楽は人間が感情を表現する手段であるため、感情のない人工知能に音楽を作曲させるというのは誤った提案かもしれません。人工知能は感情を持たず、音符やリズムといった音楽の表面的な構造と、感情表現に基づく音楽の深い論理との対応関係を理解していない。人工知能が作り出す音楽は、確率に基づいて並べられた音符に過ぎない。 アルゴリズム作曲技術がどれだけ成熟しても、人間の感情伝達の芸術形式の一つである音楽が、社会における人間の音楽の機能と役割を完全に置き換えることは決してできず、人工知能が業界のトップクラスの音楽クリエイターや演奏者に取って代わることもできない。これは音楽だけでなく、美術や文学などの他の芸術作品にも当てはまります。 Google、ソニー、AIVAに加えて、より成熟したAI音楽企業としては、英国のAI Musical、ドイツのMelodrive、米国のHumtap、Popgun、Snafu Records、多くのシリコンバレーの大物が共同で設立した人工知能の非営利団体OpenAI、ByteDance傘下のJukedeckなどがある。 Baidu、Tencent、Alibaba、NetEase Cloud などの音楽プラットフォームはいずれも、さまざまな程度で人工知能音楽の計画を立てています。 人工知能は現時点では音楽の繊細な感情の変化や流れを把握することはできませんが、コンピュータが持つ強力なデータ処理能力、計算・分析能力、大量の作品の編曲・組み合わせ能力により、人工知能の音楽編曲効率は人間をはるかに上回ります。コストを重視し、美観要件が低い一部のアプリケーション シナリオでは、AI 合成には明らかな利点があります。したがって、プロ意識に欠ける音楽実践者のグループは排除される運命に直面する可能性があります。 現在、人工知能作曲技術は徐々に商業応用と創作支援に向けて発展しています。「スマート相対理論」は、その応用シナリオは主にビデオ音楽、ゲーム音楽、テレビ予告編、コマーシャル、記者会見、映画であると見ています。 主な市場は非芸術的なシナリオでの商業音楽であり、コストと作成時間に関する既存の音楽市場の制限を打ち破っています。 前述のように、AIVA は映画、ビデオ、テレビシリーズの音楽の制作を開始しました。マイクロソフトインターネットエンジニアリングアカデミー(アジア)が開発したXiaoIce Bandは、メロディーや編曲フレームワークを自動生成することができ、2020年世界人工知能大会のテーマソング「スマートコネクテッドホーム」を制作した。 西電豊東人工知能及び脳型知覚産業技術研究所が開発したMuses人工知能作曲システムは、GANとLSTMのインテリジェント作曲アルゴリズムとビデオ多要素抽出アルゴリズムに基づいており、セルフサービスのビデオ作曲、インテリジェント模倣、作曲支援インテリジェンスなどの機能を実現します。 動画のコンテンツオブジェクト認識、色彩分析、画像リズム分析を行うことで、適切なバックグラウンドミュージックを生成できます。また、模倣音楽や、ユーザーが入力したメモを刺激するキーワードや文章を通じて、同様のスタイルの音楽を生成することもできます。また、ビデオのサウンドトラックの制作に特化した AI Ecrett Music もあります。さまざまなビデオのテーマ、時間、感情を識別してビデオのサウンドトラックをパーソナライズし、ビデオ制作者のためにさまざまなメロディーを継続的に生成できます。これは、クリエイティブ要件が低く、価格に敏感な一部の商業音楽制作に新しいソリューションを提供します。 さらに、人工知能作曲技術は音楽愛好家の創作において補助的な役割も果たします。 2019年にリリースされた「Hengqu」アプリは、人工知能ベースの音楽作成ツールです。簡単なハミングで、AIがハミングの内容、ピッチ、メロディーに基づいて、完全で心地よい曲を生成します。さらに、生成された曲はパーソナライズでき、さまざまな楽器、スタイル、長さをワンクリックで変更できます。 「Hum Fun」の核となる原則は、大量の音楽トレーニングを通じて完全な LSTM ニューラル ネットワークを形成することです。 同時に、アルゴリズムチームはMP3とMIDIフォーマット間の相互変換とノイズ低減の問題を解決し、人間の声を機械が認識できるMIDI言語に変換し、オーディオ判断機能を備えたニューラルネットワークを使用して音楽を生成しました。 この種のソフトウェアやアプリを使用すると、音楽作成がより便利かつ迅速になるだけでなく、一般の人々が音楽を作成するハードルが大幅に下がります。プロのミュージシャンにとっては、MIDI キーボードでメロディーを入力する必要があった従来の創作方法と比較して、作業効率が大幅に向上し、反復作業が減り、プロデューサーとのコミュニケーションコストも削減されます。人工知能によってランダムに生成されたメロディーは、ユーザーが創作上の行き詰まりに陥ったときにインスピレーションを与えることもできます。作曲ツールの開発により、プロの作曲家の創造性がさらに解き放たれるでしょう。 結論 AI作曲技術は音楽産業チェーンをより効率的にし、人工知能によって作られた曲がK-POPチャートに登場することはもはや夢ではなくなるかもしれない。技術革新は課題であると同時にチャンスでもあります。科学技術の進歩により、人類はさらなる可能性を模索しながら自らの価値観を見つめ直すようになりました。 |
<<: ついに! SM2 国家暗号アルゴリズムが Linux カーネル コミュニティに承認されました
人工知能(AI)とは、人間の知能をシミュレート、拡張、拡大するための理論、方法、技術、アプリケーショ...
[[273668]] ▲写真:アクアノートロボットがNASAの中立実験室で水中浮遊テストを受けてい...
6月20日、滴滴出行研究院副院長兼アメリカ研究院長のゴン・フェンミン博士が、TechCrunch I...
方法1: ランダム生成まず、非常に一般的な方法であるランダム生成法(私が名付けました)を紹介します。...
規制は消費者と市場を保護するために設けられていますが、多くの場合、規制は複雑であり、遵守にはコストが...
「Xiaodu スマートスピーカーの価格についてお話ししましょうか?」 「売ることがそんなに失礼だな...
[[253678]] [51CTO.com クイック翻訳] 機械学習 (ML) は、パターンを識別...
人工知能は長い間、架空の物語、SF、さらには映画にも登場してきました。人々の目には、これは技術的な魔...
Huawei の Mindspore AI コンピューティング フレームワークの公式オープン ソー...
実行している機械学習の種類に応じて、モデルのパフォーマンスを測定するために使用できるメトリックは多数...
3月27日、2019 Unisound AIテクノロジーオープンデーの第一弾が北京で成功裏に開催され...
[[260198]]米テクノロジーメディアCNETによると、マイクロソフトの共同創業者で慈善家のビル...
2000年から10年間の発展を経て、中国のPC時代のインターネットは「交通経済」を生み出しました。...
2021年は間違いなく人工知能産業の発展にとって重要な年となるでしょう。わが国のスマートシティ建設の...