色を選ぶと、このAIシステムがロゴをデザインします

色を選ぶと、このAIシステムがロゴをデザインします

LoGANがデザインしたいくつかのロゴ

画像提供: マーストリヒト大学

[51CTO.com クイック翻訳] 生成的敵対ネットワーク (GAN) は、サンプルを生成するジェネレーターと、生成されたサンプルを実際のサンプルと区別しようとする識別子を含む 2 つの部分からなるニューラル ネットワークです。 GAN は、新薬の発見、ハンバーガーや蝶のリアルな写真の撮影、脳腫瘍の合成スキャンの生成など、幅広い分野で使用されています。オランダのマーストリヒト大学が発表した新しい論文によると、GAN はロゴのデザインにも非常に優れているそうです。

プレプリントサーバー Arxiv.org で公開された研究論文 (「LoGAN: 色を調整した敵対的生成ニューラルネットワークによるロゴのデザイン」、https://arxiv.org/pdf/1810.10395.pdf) で、科学者らは 12 種類の色を使用してロゴをデザインできる LoGAN と呼ばれる人工知能 (AI) システムについて説明しています。

「ロゴのデザインは、どのデザイナーにとっても長く、複雑で、費用のかかるプロセスです」と彼らは書いています。「しかし、最近の生成アルゴリズムの進歩により、実行可能なソリューションとなる可能性を秘めたモデルが提供されています。LoGAN の結果は、デザイナーの創作を支援するために AI をどのように使用できるかを示す初めてのものであり、より詳細で使いやすいシステムを提供できる、より説明的なラベルを含めるなど、将来有望な方向性を示しています。」

研究者らは、こうしたタイプの GAN の問題点は、必ずしも美しい結果が得られるわけではないことだと説明しています。彼らの解決策は、最も目立つ色、つまり黒、青、茶色、シアン、灰色、緑、オレンジ、ピンク、紫、赤、白、黄色を使用してロゴを定義することでした。

チームは、サイズが 32 x 32 ピクセルの 486,777 個の小さなアイコンで構成される LDD アイコン データセットでシステムをトレーニングしました。それぞれの小さなアイコンの主な色はアルゴリズムを使用して抽出され、RGB 値から色彩単語に変換されます。一方、システム内の 3 番目のニューラル ネットワーク (ジェネレーターとディスクリミネーターに加えて) はサンプル画像を分類します。

では、LoGAN の成果はどうでしょうか? 生成されたロゴはぼやけていますが (ソース画像の解像度が低いため)、かなりリアルなものもあります。色のキーワードを入力すると、LoGAN は不規則な形状、円形や四角形のボタン、さらには Google Chrome のロゴに似たものまで作成することができました。

興味深いことに、白とグレーは 12 色のカテゴリ全体で最も一般的な色の組み合わせの上位 3 つに含まれていました。オレンジのカテゴリでは、ニューラル ネットワークは茶色を第一に選択しましたが、黄色のカテゴリでは青色を採用することが多かったです。

研究者たちは、LoGAN のような AI システムがロゴデザインのより日常的な側面のいくつかを処理し、デザイナーが新しいアイデアをブレインストーミングできるようにすることができると考えています。今後の研究では、システムによる単語の意味理解を拡張し、色だけでなく、形や焦点などのキーワードも含めたいと考えている。

研究者らによると、改良されたシステムは、2 つの異なるデータセットでトレーニングできる。1 つは明らかな幾何学的形状のロゴを含むデータセット、もう 1 つは不規則な形状のロゴを含むデータセットである。また、「解釈可能性を向上させる」ために、最も一般的な単語でトークンを説明する埋め込みモデルを使用することもできます。

「生成されたロゴの解像度は非常に低いが、最終的なロゴの最初のドラフトとして、またはデザイナーのインスピレーションとして使用できる」と研究者は書いている。「提案されたモデルは、キーワード(私たちの場合、ロゴで最も目立つ色)を入力すると、ロゴをうまくデザインできます。このようなキーワードは、人間が簡単に区別できるロゴ属性を提供するため、説明的であると考えることができます。」

AI の力をアート制作に活用するというのは新しいアイデアではないことは言及する価値があります。アマゾンのAlexa Acceleratorプログラムから派生したBotnik Studiosは最近、一連の架空のバンド名を列挙した風刺的なコーチェラのポスターを作成するようニューラルネットワークに教えた。人気のスマートフォンアプリ「Prisma」は、スタイル転送と呼ばれる機械学習技術を使用して写真を絵画のように見せます。また、ゲームデザイン AI スタートアップの Promethean AI は、仮想の風景やインテリアを構築するプロセスを自動化します。

原題: 色を選ぶと、この AI システムがロゴを作成します、著者: カイル・ウィガーズ

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  自動運転データの所有権をめぐる戦い

>>:  AIと情報サービスが出会うとき:百度脳産業イノベーションフォーラムが成都であなたを待っています

ブログ    
ブログ    

推薦する

...

Baidu Create 2018 ディープラーニング フロンティア テクノロジーと産業応用公開コースのハイライト

[51CTO.com からのオリジナル記事] 中国の開発者が集まる毎年恒例の盛大な集まりである Ba...

ビッグデータの本当の問題と、なぜ機械学習だけがそれを解決できるのか

多くの企業が、データの取得から洞察の獲得まで、スムーズに実行されるパイプラインの構築に依然として苦労...

...

数学が苦手でも機械学習を学ぶことはできますか?

[[381131]] 01 「機械学習は簡単に習得できますか?」これは私が最も頻繁に聞かれる質問で...

...

Ant Group は、動画の著作権侵害検出用に 16 万本の動画ペアと 28 万本のクリップペアからなる大規模なデータセットを公開しました。

従来の著作権保護業界は、時間がかかり、労働集約的で、コストがかかります。膨大な量のコンテンツを完全に...

...

ロボットに髪を切らせるという突飛なアイデアを思いついた

一人でいて理髪店に行きたくない場合はどうすればいいでしょうか? YouTube ビデオブロガーの S...

...

...

ChatGPTが使用する機械学習技術

著者 |ブライト・リャオ「プログラマーから見たChatGPT」の記事では、開発者のChatGPTに対...

ディープラーニング入門

2016年、Googleの人工知能プログラムAlphaGoが世界的囲碁プレイヤーのイ・セドルと対戦し...

Google が基本世界モデルをリリース: 110 億のパラメータ、インタラクティブな仮想世界を生成可能

Sora がリリースされてからまだ 2 週間も経っていないが、Google の世界モデルが登場し、そ...

中国の研究チームが86%の精度を誇るAI「皮肉」検出モデルを発表

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...