この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この日本のAIは話題になっています: スケッチを2Dの妻にリアルタイムで変換でき、512の調整可能なパラメータがあります

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

絵を描くのが得意ではないけれど、自分だけの2Dワイフが欲しい場合はどうすればいいでしょうか?

問題ない。

本当に、手があればいいんです:

この AI はかなり優秀だと言わざるを得ません。彼女が描いた絵はまさに私の将来の妻に似ています!

はい、スケッチさえ提供できれば、AI はそれを二次元美少女に変換できるので、「どんなにスケッチっぽくても問題ありません」と言えます。

このAIは、日本のイラストサイト「Pixiv」の公式技術者によって「パートタイム」で開発されたもので、かつてはデイリートレンドリストのトップにランクインし、現在では約16万件の「いいね!」を獲得している。

その後、作者は512個のパラメータスライダーも追加し、ペイントスタイル、顔の投影、形状など、さまざまな側面を変更できるようになりました。詳細な設定は8192種類にも達しました。

コメント欄のネットユーザーはこう言った。

やめて!アーティストをこれ以上時代遅れにしないでください!

障害者でも描ける

下のコメント欄は現在、3つの主要な陣営によって占められています。

AI の絵画から新しい妻を幸せに選ぶ人もいます。

コメント欄には「大好きな顔が一瞬で現れてびっくり」といったコメントが溢れるだろうと思っていたら、そうでもなかった。それで、私のお気に入りをいくつか投稿しました。とてもかわいいです...

あ、ちなみにこの子を突き飛ばしたのは私です。

この小さな AI から離れて、このテクノロジーがイラストレーターの仕事を奪っているかどうかを真剣に考えることもできます。

コメント欄の最前列にいた個人イラストレーターと同じように、彼も複雑な気持ちだった。

もし誰かが私に、これによって画家としての仕事を失うことになるかと尋ねたら、私の答えは「いいえ」でしょう。しかし、私のように一生懸命働いている人間にとっては、この技術を説明するのは少し難しいように感じます。

漫画の神様・手塚治虫の全作品を学習し、手塚治虫風の新作「ぱいどん」を「創作」したという以前のAIを思い浮かべる人もいただろう。

テクノロジーが創作活動に干渉するというこの傾向について、ネットユーザーたちは、これが真の芸術的創作活動にとって祝福なのか呪いなのか分からないと述べている…

しかし、「考えすぎだ」と言う穏健派も多くいます。

世界一のお姫様、バーチャルシンガーの初音ミクのように、彼女の登場でリアルシンガーの数が減ることはないですよね?

それどころか、彼女のおかげで多くの若者が音楽に夢中になったのです。

そのため、どれだけ技術が発達しても「画家が必要なくなる」という状況は起こりません。

「テクノロジーは単なるツールに過ぎない」と固く信じているコメントもあります。

原作者の作業には影響はありませんが、アニメの制作効率は向上します。

もちろん、こうしたやや白熱した議論に加え、作者はデモ動画のみを公開しているため、コメント欄にはオープンソースやデモを求めるネットユーザーが多数現れている。

StyleGANをベースにした開発

著者は直接回答しなかったが、これまでの号ではスケッチから絵や顔を生成するための多くの手法を紹介してきた。

この AI もStyleGAN をベースにさらに発展したものになるはずです。

2019年に登場したこのアルゴリズムは、顔生成技術における大きな前進と言えるでしょう。

これまでの GAN は画像生成の解像度と品質に優れていましたが、研究者は画像のランダムな特徴を制御する方法など、画像生成プロセスをより深く理解できていません。

StyleGAN は GAN のジェネレーター ネットワーク構造を再設計しました。

ジェネレーターは学習した定数入力から開始し、潜在コードに基づいて各畳み込み層の画像「スタイル」を調整し、それによって画像の特徴、ひいては画像生成プロセス全体を直接制御します。

同時に、このプロセスはネットワークに直接注入されたノイズと組み合わせて、生成された画像のランダムな特性を直接変更できるため、StyleGAN に基づく新しいものが無限にあることもわかります。

著者はPixiv公式技術チームのメンバーです

実は冒頭でも述べたように、このAIは作者による実験的なアマチュア開発であり、開発者自身はPixiv公式VRoidチームのメンバーです。

このチームの主力製品は、Pixivが2018年にリリースした「2D方式で3Dモデルを作る」ことにフォーカスした3Dキャラクター作成ソフトウェア「VRoid Studio」です。

このように、アーティストはソフトウェアにプリセットされた 3D モデルに 2D で直接描画し、必要に応じてパラメータを調整できます。調整の結果は、3D モデルにリアルタイムで反映されます。

おそらくそれは彼の職業に関係しているのでしょう。開発者はまた、将来的には、スケッチを漫画に変換できるアマチュアAIに3Dモデル生成機能を追加し、スケッチから3次元までをワンステップで実行できるようにすると述べました。

この点に関しては、私のような不器用な人間は「GKD」としか言えません。

<<:  ビッグデータアルゴリズムにもっと積極的な役割を担わせる

>>:  データの筒状のビジョンを避け、人間と機械の調和のとれた共生関係を築く

ブログ    

推薦する

GitHubが11,000スターを獲得、ソフトウェア開発プロセスをシミュレート、オープンソースフレームワークMetaGPTが爆発的に増加

大規模言語モデル (LLM) が成熟するにつれて、それを使用して AI エージェントを構築することが...

Google Cloud と Hugging Face が AI インフラストラクチャ パートナーシップを締結

Google LLC のクラウド コンピューティング部門は本日、オープンソースの人工知能モデルを共有...

データと人工知能の整合性をどのように確保するか?

2022 年、データと AI はデジタル革命の新たな章の基盤を築き、ますます多くのグローバル企業に...

Github のトップ 5 オープンソース機械学習プロジェクト!データ計算が最大80倍高速化!

挑戦的なオープンソース機械学習プロジェクト 5 つで、2020 年を良いスタートを切りましょう。これ...

AIはどのようにして責任を持つようになるのでしょうか?英国規格協会が答えを持っている

人工知能(AI)は、現在世界で最も革新的で影響力のある技術の1つであり、さまざまな分野や産業に浸透し...

デジタルトランスフォーメーションにおけるAIビッグモデルの現状と役割を客観的に見る

「デジタル変革における AI ビッグモデルの役割は、『データ中心のビジネス変革の 3 つのパラダイム...

Google検索は非常に勤勉で、そのコアアルゴリズムは毎日変化しています

Googleの検索事業責任者アミット・シンガル氏は最近、Google+に記事を掲載し、過去1年だけで...

2020年に人工知能を始める正しい方法、トップ10のテクノロジートレンド予測が発表されました

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

過去 2 週間で AI の進路を変える可能性が最も高い 6 つのリリース!

編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:blog)過去 2 ...

ジェネレーティブ AI 初心者ガイド

ソフトウェア アーキテクトとして、私は人工知能 (AI) の発展とさまざまな業界でのその応用を目の当...

将来、人間はAIに置き換えられるのでしょうか?人工知能の種類と発展段階を1つの記事で理解する

21 世紀に革命をもたらした技術が一つあるとすれば、それは人工知能です。 Googleの新社長サンダ...

ノキア、ネットワーク自動化におけるAI推進のためドバイに「イノベーションラボ」を開設すると発表

9月26日、海外メディアETテレコムによると、ノキアは中東とアフリカでの技術革新を促進し、ネットワー...

...

AIがIT業界とAV業界にもたらす変化

[51CTO.com クイック翻訳]人工知能が情報技術 (IT) 業界とオーディオビジュアル (AV...

...