ワンクリックで顔のピクセル画像を生成し、Animal Crossingにアップロードしましょう!このプロジェクトは楽しい

ワンクリックで顔のピクセル画像を生成し、Animal Crossingにアップロードしましょう!このプロジェクトは楽しい

日本の独立系開発者佐藤氏はアスペルガー症候群のため学校を中退、退職。その後独学でAIを学び、AI画伯プロジェクト(AI Master Painter)を開発。日米で大反響を呼び、10日間でユーザー数100万人を達成した。さらに、彼女は入力画像をワンクリックでピクセル絵画に変換できる PixelMe という別の興味深いプロジェクトも作成しました。

画像をピクセルアートに変換するためにまだ PS を使用していますか?日本の独立系開発者佐藤ニート氏は独学で人工知能技術を学び、ポートレート写真をワンクリックでピクセルアートに変換できるウェブサイト「PixelMe」を開発した。生成された画像は、最近人気のゲーム「あつまれ どうぶつの森」にインポートすることもできる。

それだけでなく、このウェブサイトにはペットモードもあり、ペットの写真をピクセル絵画に変換することができます。

PixelMe URL: https://pixel-me.tokyo/en/

まずは効果を見てみましょう:

PixelMe による画像変換効果。左上は入力画像、右上は 128x128 ピクセルの生成結果、2 行目はそれぞれ 64x64、48x48、32x32 ピクセルの生成結果です。

処理中にポートレート写真が切り取られ、頭部のみが残されていることがわかります。変換された画像には、128x128、64x64、48x48、32x32 の 4 つのピクセル タイプがあり、ユーザーが選択できます。

また、変換結果のデフォルトの背景色は無色ですが、ユーザーは背景色をカスタマイズできます。

背景色が空色に設定された、変換された 128 x 128 ピクセルの画像。

次はペットモードを試してみましょう。猫ちゃんにアクションをさせてあげましょう!

効果はOKですが、醜いマスターはもっと醜いようです...

ピクセル化も見た目次第のようです。

効果を確認したところで、PixelMe の技術的な詳細を見てみましょう。

PixelMeピクセルマップ変換の原理

Pixel-me は、pix2pix モデルを使用して 8 ビット スタイルのポートレート画像を生成します。

Pix2pix は、Zhu Junyan らが執筆した論文「Image-to-Image Translation with Conditional Adversarial Networks」から生まれた、GAN アーキテクチャに基づくスタイル転送モデルです。 Pix2pix は、ペアになった画像データを使用して、ある画像から別の画像に変換する方法を学習し、リアルな画像を生成します。

pix2pix を使用して、さまざまなスタイルや目的の画像を変換します。

PixelMe と pix2pix の違いは、モデルのトレーニングにピクセル化された画像を使用し、モデルがピクセル画像を出力する点です。

著者について

これらの興味深いプロジェクトの作成者は人工知能の訓練を受けていません。佐藤さんは10年前に東京の学校を中退し、その後看護学校に通い、パン職人としての訓練も受けた。アスペルガー症候群のため職場環境にうまく適応できないかもしれないと気づいた佐藤さんは、人工知能というまったく新しい分野に挑戦することを決意した。

佐藤さんは2年前からAIの勉強を始めました。佐藤さんは大学で基本的なプログラミングの授業をいくつか受けただけでしたが、最新の AI テクノロジーを使って興味深いプロジェクトを作成し、それをコミュニティと共有できるように、Python と JavaScript を学びたいと考えていました。

佐藤さんは、上で紹介したPixelMeのほかにも、独自に開発したプロジェクト「AI画伯」を今年3月にリリースしている。このプロジェクトでは、ユーザーがウェブサイトにアップロードした肖像写真を古典絵画風の絵画に変換することができます。

AI画伯 URL: https://ai-art.tokyo/en#/

引き続き男性の写真を例にとると、AI 画伯によって生成された油絵は以下のようになります。

AI ガハクの出現効果。左の画像が入力で、右の画像が出力のクラシックスタイルの肖像画です。

さらに、このプロジェクトではフィルターの使用もサポートされており、ユーザーはさまざまなフィルターをクリックして、生成された絵画のスタイルを変更できます。

このウェブサイトでは、画像スタイルの転送に pix2pix ベースの ML モデルも使用しており、アップロードされた写真を入力として受け取り、リアルなクラシックなポートレートを生成します。

このウェブサイトはTwitterで共有された後、まず日本で話題となり、その後アメリカやその他の国でも話題になりました。現在、AI画伯は世界中で毎日約100万人のユーザーが利用しています。

佐藤がやったらしい。

<<:  データサイエンスと機械学習の違いは何ですか?

>>:  人工知能はコロナウイルスの流行との戦いにどのように役立つのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

私はトップ200のAIツールを調査しましたが、業界が少し飽和状態にあることがわかりました

LinkedIn では、機械学習の職種に応募する人の多くに 200 人を超える応募者がいます。 AI...

がん治療のブレークスルー:AIGCの医薬品開発における役割

AIGC には、がんの治療に役立つ可能性など、驚くべき用途を含め、多くの潜在的な用途があります。 M...

産業用ロボットのプログラミングにはどの言語が使用されますか?

多くの友人から、産業用ロボットのプログラミングにはどの言語が使用されるのかと尋ねられました。今回は、...

機械学習による分類とその応用を理解するための図

機械学習は主に教師あり学習、教師なし学習、強化学習に分けられます。ただし、各手法の適用分野はそれぞれ...

スポットロボット犬が古代ポンペイの警備員として活躍!墓泥棒を防ぐだけでなく、宙返りや3Dモデリングもできる

ボストン・ダイナミクスのロボット犬は、ダンスビデオを毎年リリースしているほか、さまざまな産業や警察署...

興味深いアルゴリズムを知っていますか?

[[428794]]この記事はWeChatの公開アカウント「WeDoctor Front-end ...

データサイエンスの面接で必ず知っておくべき 5 つの質問

同じ場所で二度失敗することがないように、そして他の人の役に立つために、私は自分の情熱に従ってデータ ...

160本の論文を体系的に調査した、分野初の総合レビューが出版され、IJCAI 2021に受理されました。

[[397024]]ドメイン一般化 (DG) は近年非常に人気のある研究方向となっています。研究す...

わずか4つの例から、DeepMindの800億のモデルは本当に学習した

知能の鍵となるのは、簡単な指示を与えられて新しいタスクを実行する方法を素早く学習する能力です。たとえ...

人工知能は企業で実用化されつつある

AI は、従来のプロセスや従来のテクノロジーにまき散らされた魔法の精霊ではなく、ビジネスのやり方を根...

コード生成のためのツリーベースのTransformerアーキテクチャ

導入:コード生成は、プログラマーの生産性を大幅に向上させる可能性を秘めた重要な AI 問題です。自然...

データセンターで自動化できない 5 つのこと

データセンター内外を問わず、自動化に境界はないと考えるのは簡単です。 AI がデータ センターの運用...

Zhiyuan が世界最大の中国語と英語のベクトルモデルトレーニングデータセットをリリースしました。最大3億のテキストペアまで拡張可能

9月15日、北京人工知能産業サミットおよび中関村科学城科学技術イノベーションコンテスト授賞式において...

2025年以降の人工知能の未来(パート1)

[[420733]] 2025 年までに、人工知能 (AI) は、今日の複雑なタスクの一部を効率的...

GPT-4/Llama2のパフォーマンスを大幅に向上させるためにRLHFは必要ない、北京大学のチームはAlignerの新しいアライメントパラダイムを提案

背景大規模言語モデル (LLM) は強力な機能を発揮していますが、不快な応答、虚偽の情報、漏洩した個...