色を選ぶと、このAIシステムがロゴをデザインします

色を選ぶと、このAIシステムがロゴをデザインします

LoGANがデザインしたいくつかのロゴ

画像提供: マーストリヒト大学

[51CTO.com クイック翻訳] 生成的敵対ネットワーク (GAN) は、サンプルを生成するジェネレーターと、生成されたサンプルを実際のサンプルと区別しようとする識別子を含む 2 つの部分からなるニューラル ネットワークです。 GAN は、新薬の発見、ハンバーガーや蝶のリアルな写真の撮影、脳腫瘍の合成スキャンの生成など、幅広い分野で使用されています。オランダのマーストリヒト大学が発表した新しい論文によると、GAN はロゴのデザインにも非常に優れているそうです。

プレプリントサーバー Arxiv.org で公開された研究論文 (「LoGAN: 色を調整した敵対的生成ニューラルネットワークによるロゴのデザイン」、https://arxiv.org/pdf/1810.10395.pdf) で、科学者らは 12 種類の色を使用してロゴをデザインできる LoGAN と呼ばれる人工知能 (AI) システムについて説明しています。

「ロゴのデザインは、どのデザイナーにとっても長く、複雑で、費用のかかるプロセスです」と彼らは書いています。「しかし、最近の生成アルゴリズムの進歩により、実行可能なソリューションとなる可能性を秘めたモデルが提供されています。LoGAN の結果は、デザイナーの創作を支援するために AI をどのように使用できるかを示す初めてのものであり、より詳細で使いやすいシステムを提供できる、より説明的なラベルを含めるなど、将来有望な方向性を示しています。」

研究者らは、こうしたタイプの GAN の問題点は、必ずしも美しい結果が得られるわけではないことだと説明しています。彼らの解決策は、最も目立つ色、つまり黒、青、茶色、シアン、灰色、緑、オレンジ、ピンク、紫、赤、白、黄色を使用してロゴを定義することでした。

チームは、サイズが 32 x 32 ピクセルの 486,777 個の小さなアイコンで構成される LDD アイコン データセットでシステムをトレーニングしました。それぞれの小さなアイコンの主な色はアルゴリズムを使用して抽出され、RGB 値から色彩単語に変換されます。一方、システム内の 3 番目のニューラル ネットワーク (ジェネレーターとディスクリミネーターに加えて) はサンプル画像を分類します。

では、LoGAN の成果はどうでしょうか? 生成されたロゴはぼやけていますが (ソース画像の解像度が低いため)、かなりリアルなものもあります。色のキーワードを入力すると、LoGAN は不規則な形状、円形や四角形のボタン、さらには Google Chrome のロゴに似たものまで作成することができました。

興味深いことに、白とグレーは 12 色のカテゴリ全体で最も一般的な色の組み合わせの上位 3 つに含まれていました。オレンジのカテゴリでは、ニューラル ネットワークは茶色を第一に選択しましたが、黄色のカテゴリでは青色を採用することが多かったです。

研究者たちは、LoGAN のような AI システムがロゴデザインのより日常的な側面のいくつかを処理し、デザイナーが新しいアイデアをブレインストーミングできるようにすることができると考えています。今後の研究では、システムによる単語の意味理解を拡張し、色だけでなく、形や焦点などのキーワードも含めたいと考えている。

研究者らによると、改良されたシステムは、2 つの異なるデータセットでトレーニングできる。1 つは明らかな幾何学的形状のロゴを含むデータセット、もう 1 つは不規則な形状のロゴを含むデータセットである。また、「解釈可能性を向上させる」ために、最も一般的な単語でトークンを説明する埋め込みモデルを使用することもできます。

「生成されたロゴの解像度は非常に低いが、最終的なロゴの最初のドラフトとして、またはデザイナーのインスピレーションとして使用できる」と研究者は書いている。「提案されたモデルは、キーワード(私たちの場合、ロゴで最も目立つ色)を入力すると、ロゴをうまくデザインできます。このようなキーワードは、人間が簡単に区別できるロゴ属性を提供するため、説明的であると考えることができます。」

AI の力をアート制作に活用するというのは新しいアイデアではないことは言及する価値があります。アマゾンのAlexa Acceleratorプログラムから派生したBotnik Studiosは最近、一連の架空のバンド名を列挙した風刺的なコーチェラのポスターを作成するようニューラルネットワークに教えた。人気のスマートフォンアプリ「Prisma」は、スタイル転送と呼ばれる機械学習技術を使用して写真を絵画のように見せます。また、ゲームデザイン AI スタートアップの Promethean AI は、仮想の風景やインテリアを構築するプロセスを自動化します。

原題: 色を選ぶと、この AI システムがロゴを作成します、著者: カイル・ウィガーズ

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  自動運転データの所有権をめぐる戦い

>>:  AIと情報サービスが出会うとき:百度脳産業イノベーションフォーラムが成都であなたを待っています

ブログ    
ブログ    
ブログ    

推薦する

...

大規模モデルのニューロンを分解します!クロードチームの最新の研究が人気を集め、ネットユーザー:ブラックボックスを開けよう

ニューラルネットワークの説明不可能性は、AI の分野では常に「長年の」問題となってきました。しかし、...

...

ヘルスケアにおける機械学習の悪影響

Marzyeh Ghassemi 助教授は、医療データに隠れたバイアスが人工知能のアプローチにどのよ...

間隔適応型ルックアップテーブルに基づくリアルタイム画像強調法

最近、アリババ・タオバオ・テクノロジーと上海交通大学画像通信・ネットワーク工学研究所(IGI)による...

2022 年に予測されるロボット技術のトレンド トップ 10

COVID-19パンデミックは、物流やスーパーマーケットなどの分野に問題と機会の両方をもたらしまし...

人工知能のセキュリティ:将来の戦争のリスクと課題

人工知能技術の発展に伴い、人工知能はあらゆる分野で広く利用されるようになり、人類社会に広範かつ深遠な...

完全なルーティングアルゴリズムの設計目標の分析

ルーティング アルゴリズムには通常、次の 1 つ以上の設計目標があります。最適化最適化とは、メトリッ...

人工知能の代表的な応用分野トップ10の一覧と技術原理の図解

[[329146]]この記事では、「アルゴリズム」という単語を非常に簡略化して使用し、単一のアルゴリ...

人工知能とIoTがガソリン小売業界を変革

ネットワークは常に企業の神経系であり、ビジネス プロセスとトランザクションはネットワークを通じてのみ...

Google Brainは、T5の最大7倍の事前トレーニング速度を備えた簡素化されたスパースアーキテクチャを提案しています。

先ほど、Google Brainのシニア研究科学者であるBarret Zoph氏が、言語モデルのパラ...

ついに誰かが説明可能な機械学習を明らかにした

[[443127]]ビッグデータの時代において、機械学習は製品の売上向上や人間の意思決定の支援に大き...

マスク氏がxAIの目標を設定:汎用人工知能の実現期限は2029年

「xAIの目標は、宇宙を理解することを主な目的とする、真のAGI(人工汎用知能)を構築することです」...