色を選ぶと、このAIシステムがロゴをデザインします

色を選ぶと、このAIシステムがロゴをデザインします

LoGANがデザインしたいくつかのロゴ

画像提供: マーストリヒト大学

[51CTO.com クイック翻訳] 生成的敵対ネットワーク (GAN) は、サンプルを生成するジェネレーターと、生成されたサンプルを実際のサンプルと区別しようとする識別子を含む 2 つの部分からなるニューラル ネットワークです。 GAN は、新薬の発見、ハンバーガーや蝶のリアルな写真の撮影、脳腫瘍の合成スキャンの生成など、幅広い分野で使用されています。オランダのマーストリヒト大学が発表した新しい論文によると、GAN はロゴのデザインにも非常に優れているそうです。

プレプリントサーバー Arxiv.org で公開された研究論文 (「LoGAN: 色を調整した敵対的生成ニューラルネットワークによるロゴのデザイン」、https://arxiv.org/pdf/1810.10395.pdf) で、科学者らは 12 種類の色を使用してロゴをデザインできる LoGAN と呼ばれる人工知能 (AI) システムについて説明しています。

「ロゴのデザインは、どのデザイナーにとっても長く、複雑で、費用のかかるプロセスです」と彼らは書いています。「しかし、最近の生成アルゴリズムの進歩により、実行可能なソリューションとなる可能性を秘めたモデルが提供されています。LoGAN の結果は、デザイナーの創作を支援するために AI をどのように使用できるかを示す初めてのものであり、より詳細で使いやすいシステムを提供できる、より説明的なラベルを含めるなど、将来有望な方向性を示しています。」

研究者らは、こうしたタイプの GAN の問題点は、必ずしも美しい結果が得られるわけではないことだと説明しています。彼らの解決策は、最も目立つ色、つまり黒、青、茶色、シアン、灰色、緑、オレンジ、ピンク、紫、赤、白、黄色を使用してロゴを定義することでした。

チームは、サイズが 32 x 32 ピクセルの 486,777 個の小さなアイコンで構成される LDD アイコン データセットでシステムをトレーニングしました。それぞれの小さなアイコンの主な色はアルゴリズムを使用して抽出され、RGB 値から色彩単語に変換されます。一方、システム内の 3 番目のニューラル ネットワーク (ジェネレーターとディスクリミネーターに加えて) はサンプル画像を分類します。

では、LoGAN の成果はどうでしょうか? 生成されたロゴはぼやけていますが (ソース画像の解像度が低いため)、かなりリアルなものもあります。色のキーワードを入力すると、LoGAN は不規則な形状、円形や四角形のボタン、さらには Google Chrome のロゴに似たものまで作成することができました。

興味深いことに、白とグレーは 12 色のカテゴリ全体で最も一般的な色の組み合わせの上位 3 つに含まれていました。オレンジのカテゴリでは、ニューラル ネットワークは茶色を第一に選択しましたが、黄色のカテゴリでは青色を採用することが多かったです。

研究者たちは、LoGAN のような AI システムがロゴデザインのより日常的な側面のいくつかを処理し、デザイナーが新しいアイデアをブレインストーミングできるようにすることができると考えています。今後の研究では、システムによる単語の意味理解を拡張し、色だけでなく、形や焦点などのキーワードも含めたいと考えている。

研究者らによると、改良されたシステムは、2 つの異なるデータセットでトレーニングできる。1 つは明らかな幾何学的形状のロゴを含むデータセット、もう 1 つは不規則な形状のロゴを含むデータセットである。また、「解釈可能性を向上させる」ために、最も一般的な単語でトークンを説明する埋め込みモデルを使用することもできます。

「生成されたロゴの解像度は非常に低いが、最終的なロゴの最初のドラフトとして、またはデザイナーのインスピレーションとして使用できる」と研究者は書いている。「提案されたモデルは、キーワード(私たちの場合、ロゴで最も目立つ色)を入力すると、ロゴをうまくデザインできます。このようなキーワードは、人間が簡単に区別できるロゴ属性を提供するため、説明的であると考えることができます。」

AI の力をアート制作に活用するというのは新しいアイデアではないことは言及する価値があります。アマゾンのAlexa Acceleratorプログラムから派生したBotnik Studiosは最近、一連の架空のバンド名を列挙した風刺的なコーチェラのポスターを作成するようニューラルネットワークに教えた。人気のスマートフォンアプリ「Prisma」は、スタイル転送と呼ばれる機械学習技術を使用して写真を絵画のように見せます。また、ゲームデザイン AI スタートアップの Promethean AI は、仮想の風景やインテリアを構築するプロセスを自動化します。

原題: 色を選ぶと、この AI システムがロゴを作成します、著者: カイル・ウィガーズ

[51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください]

<<:  自動運転データの所有権をめぐる戦い

>>:  AIと情報サービスが出会うとき:百度脳産業イノベーションフォーラムが成都であなたを待っています

ブログ    

推薦する

この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

サプライチェーン管理における自動化の重要性

今日のペースが速く競争の激しいビジネス環境において、サプライ チェーン管理は成功に不可欠な要素です。...

進化する決定木: 機械学習が生物学からヒントを得るとき

生物学(または生命科学)に対する理解は時間の経過とともに大きく深まり、多くのエンジニアにとって、困難...

新しいプログラミングパラダイム: Spring Boot と OpenAI の出会い

2023年にはAI技術が話題となり、プログラミングを中心に多くの分野に影響を及ぼします。 Sprin...

...

2021年にAIが農業を改善する可能性のある10の方法

PwCは、モノのインターネット(IoTAg)ベースの農業モニタリングがコネクテッドスマート農業の分野...

笑顔は73年にわたる:ディープフェイクがイスラエル建国戦争の古い写真を「復活」させる

[[434314]]ディープフェイクを使って古い写真をアニメ化し、殉教者を追悼するのは良いことだが、...

人工知能時代の未来の人材をどう育成するか?専門家や名門校の校長はこう言う

人工知能の時代、未来の人材をどう育成するか? 10日、2019年重慶人材大会第4回大学・高校教育発展...

ChatGPT を助手席に乗せましょう!清華大学、中国科学院、MITが共同でCo-Pilotヒューマン・コンピュータ・インタラクション・フレームワークを提案:乗客の意図を完璧に制御

今年の人工知能分野における最も重要なブレークスルーの一つとして、大規模言語モデルの研究は常に主要な関...

...

機械学習モデルのトレーニングの全プロセス!

週末に家で退屈していたので、GitHub を閲覧していたところ、非常に興味深いオープンソース プロジ...

5Gヘルスケアの7つの未来

病院が導入する医療機器やモバイルデバイスが増えるにつれて、医療システムの IT インフラストラクチャ...

Nvidia 3090が180億パラメータの大規模モデルに単独で挑む。今度は国内オープンソースプロジェクトが大暴れ

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AWS が ML プラットフォーム SageMaker の 9 つの主要なアップデートを発表

【51CTO.com クイック翻訳】 Amazon Web Services (AWS) は、クラウ...

世界人工知能会議が開幕。ジャック・マー、ロビン・リー、イーロン・マスクらは何を語ったのか?

昨日、第3回世界人工知能大会が予定通り開催され、ジャック・マー氏、ロビン・リー氏、任宇新氏など国内の...