人工知能「XiaoIce」がデザイナーに変身した経緯が明らかに

人工知能「XiaoIce」がデザイナーに変身した経緯が明らかに

最近、一部のネットユーザーは、ファッションブランドSELECTEDがWeChat公式アカウントでMicrosoft Xiaoiceをアシスタントデザイナーとして採用し、両者が共同で「都市のスカイライン」をテーマにしたTシャツを発売することを発表したことを発見した。これは、マイクロソフトが数か月前にXiaoIceが人工知能の創造性を持ち、詩人や歌手になったと発表した後の新たな動きである。

[[201427]]

Tシャツのデザインプロセスは、以前の創作モデルと似ています。Xiaoiceも、あるインスピレーションの源を特定することから始まります。違いは、以前は写真が啓示として使用されていたのに対し、今回は歌やオーディオクリップが創作の出発点として使用されたことです。

それぞれの曲には異なるメロディーとリズムがあるため、歌う人によって感情や気持ちも異なります。 Xiaoice は、曲ごとに都市の特徴を持つさまざまなスカイラインを描き、また、憂鬱、リラックス、興奮など、歌手が伝えるさまざまな感情に応じてスカイラインを描きます。

作者と同じ疑問を持つ人もいるだろう。詩人としてデビューした時、小氷は絵を特定し、それをいわゆるインスピレーションとして詩を創作した。しかし、このいわゆるインスピレーションは人間には説明できない。マイクロソフトの役員でさえ、このインスピレーションはブラックボックスの創造であると説明した。すべては小氷の自発的なものであり、原理を知る者は誰もいなかった。この作品はどんな感じでしょうか?これも説明できないのでしょうか?

筆者は、その理由を分析するために、業界の専門家数名に連絡を取った。今回のXiaoIceの音楽デザイン作成は、計算音楽学モデルに基づいており、曲のリズム、メロディー、コードカラー、感情などの特徴を分析し、意味空間全体のディープニューラルネットワークを通じて、画像と音楽の特徴を一致させるように作成した。

簡単に言えば、シャオビンはまず各都市のランドマーク的な建物などの要素を学び、その後、絵を描く過程で、主に曲のリズムとメロディーに基づいてデザインします。同時に、以前に学んだ基礎に基づいて、メロディーの特徴に合ったスカイラインの輪郭を描き、歌手が伝える独特の感情を使用して、その感情を最もよく表現する絵画スタイルをレンダリングします。

<<:  Google の自動運転車の秘密の世界を解明: 初めて公開された強力なツールの数々

>>:  Appleは人工知能の分野で追い上げており、その視覚認識の成果は業界の賞を受賞した

ブログ    
ブログ    
ブログ    

推薦する

コンピューティングパワーがボトルネックにならないように、Xiaohongshu の機械学習の異種ハードウェア推論を最適化する方法

多くの企業が GPU コンピューティング能力の開発を組み合わせて、自社の機械学習の問題に対するソリュ...

GitHub のスター数が 16.9k に急上昇、MetaGPT はインターネット全体で人気に!

著者 | 王 睿平今日、大規模言語モデル技術が継続的に成熟するにつれ、専門家はそれを活用してインテリ...

目標を達成するために、Google AI は自身の体をこのように変形させました...

[[246219]]強化学習 AI がゲームをプレイすることは珍しくありません。インテリジェントエ...

フロントエンドではアルゴリズムを理解する必要はないと思いますか?実際の例を見てみましょう。

[[431020]]アルゴリズムは、問題を解決するための手順です。同じ問題でも複数の解決策が存在す...

Equinix CIO: AI を活用して潜在能力の高いパートナーを見つける

多国籍データ インフラストラクチャ企業である Equinix は、機械学習の確率モデルを使用して潜在...

機械プログラミングが次に投資すべきテクノロジーである理由は何ですか?

[[413321]] [51CTO.com クイック翻訳]一連の新しいツールは、機械学習やその他の...

アリババの顔認識セキュリティ技術が3Dマスク攻撃を防ぐ特許を取得

[[334032]]顔認識と 3D テクノロジーが融合したとき、最終的な勝者は誰になるでしょうか? ...

強化学習のゴッドファーザーによる新しい論文では、意思決定エージェントの普遍的なモデルを探求しています。学際的な共通点を見つける

強化学習と意思決定に関する学際会議 (RLDM) の重要な前提は、複数の分野が長期にわたる目標指向の...

Google の FLoC アルゴリズムは、プライバシー保護の向上か、広告テクノロジーの向上か?

Android システムでは、Nut Hidden APP をダウンロードして、セキュリティリスク...

Baidu PaddlePaddleは4つの新しい業界アプリケーション開発キットをリリースし、業界インテリジェンスのアップグレードを支援するマスターモードを革新しました

産業社会の急速かつ安定した発展は、完璧なインフラと切り離すことはできません。ディープラーニングフレー...

美団におけるナレッジグラフ可視化技術の実践と探究

著者 | 魏耀成魏ナレッジ グラフの視覚化により、ナレッジ グラフ データをより直感的に表示および分...

蘇寧における知識抽出分野におけるディープラーニングの試みと実践

[[257470]] 【51CTO.comオリジナル記事】背景近年、膨大なデータの蓄積、計算能力の向...

混合交通流におけるコネクテッド自動運転車の衝突回避方法: モデルベースの強化学習アプローチ

[[429494]] 2021年10月11日にarXivにアップロードされた論文「混合交通流における...

スタンフォード大学の学生が出会い系アプリをハッキング! GAN モデルを使用して男性に変装し、顔認識システムを欺く

誰かが本当にあなたの顔を真似して、顔認識システムを回避できるのです! 最近、スタンフォード大学の研究...

上級アーキテクトが初めて秘密を明かす:Toutiao の推奨アルゴリズムの原理を 3 分で学ぶ

[[217643]]現在、アルゴリズムの配布は、情報プラットフォーム、検索エンジン、ブラウザ、ソーシ...