写真をビデオに変換するには、指 1 本だけが必要です。 Gen-2スポーツブラシが無料で利用可能になりました。ネットユーザー:史上最高のアップデート

写真をビデオに変換するには、指 1 本だけが必要です。 Gen-2スポーツブラシが無料で利用可能になりました。ネットユーザー:史上最高のアップデート

「ポイント」すると動きます。Gen-2の新機能「マジックブラシ 馬亮」が正式にリリースされました。

無料アカウントを持つユーザー(強調追加)を含むすべてのユーザーがこれを体験できます。

正式名称は「モーションブラシ」で、10日前に発表されると話題になりました。

画像のどこにでもブラシをかけるだけで、静止したオブジェクトを動かすことができます。

Runway が述べたように、この新しい機能は非常に重要であり、生成モデルの制御可能性における重要なマイルストーンです。

16年間ポストプロダクションに携わってきたネットユーザーは、それが誇張ではないことを証明した。

これは私がこれまでのキャリアで見た中で最も革新的で印象的な製品です。

特定のゲームプレイ

まず、Runwayml のホームページにアクセスし、ピンク色の「画像から開始」ボタンをクリックします。

その後、機能ページに移動すると、上部に無料割り当てが表示されます。通常は約 125 秒で、1 回の再生につき 4 秒かかります

「アップロード」をクリックして写真をアップロードし、作成を開始します。

もちろん、プロンプトワードを使用して自分で生成し、「無料プレビュー」をクリックしてプレビューを開き、満足のいく結果をサンプル画像として選択することもできます

次に、「モーション ブラシ」ボタンをクリックして新しいページに入り、そこでブラッシングを開始して連続していない要素を選択できます。

以下では、次のことを正確に制御することもできます。

(1)水平方向および垂直方向の動きの振幅。負の値はそれぞれ左方向と下方向を表す。

(2)「近接」の値は、要素が徐々にフェード/ぼかし/溶解する度合いを制御します。0を選択すると、移動の前後で形状が変更されません。

次に、「保存して生成」をクリックします。

私たちも簡単に試してみましたが、実際の生成時間は約 2 分でした。

雪の結晶の画像を選択し、以下の設定を行いました。

効果は以下のとおりです。

この動きは本当に雰囲気を醸し出していると言わざるを得ません。

しかし、その後のテストで次のことが判明しました。

現時点では、この機能は、火、漂う雲、漂う煙、ゆっくりと見上げる人など、比較的ゆっくりとした動きにしか適していません子猫が尻尾を振っているシーンを実現したい場合は、まだ少し難しいです。

さらに3つのメジャーアップデートがあります

上記の非常に楽しいスポーツ ブラシに加えて、Gen-2 ではさらに 3 つのメジャー アップデートとマイナー アップデートもリリースされました。

1つはスタイルプリセットです。

Runway が言うように、生成されたエフェクトの制御は動きだけでなくスタイルにも関係します。

ここで彼らは、複雑なプロンプトなしで選択できる 26 個のビデオ フィルターを初めてリリースしました。

つまり、プロンプトの説明を具体的に書く必要はありません。テンプレートを使用して、好きなスタイルやフィルターでビデオを作成できます。アニメーション、ピクセル、映画、パンク、レトロ、3D 漫画スタイルなど、あらゆるスタイルが利用可能です。

2つ目は、ディレクターモードでの精密なカメラコントロールです。

簡単に言えば、ビデオ画面のズームイン、ズームアウト、左右、上下を小数点第 1 位までの精度で制御でき、簡単に大ヒット映画のようなビデオを作成できます。

この機能はモーション ブラシと組み合わせて使用​​できる点に特に注目してください。

つまり、まず絵画の一部を動かし、次に大作映画を撮影する監督のようにカメラを動かして、絵全体をさまざまな程度に動かすのです。

以下は、カメラを 4 つの異なる角度で左に動かした場合の効果を示しています。

最後に、画像生成品質が向上しました。

何が良いのでしょうか?答えは、より高い解像度、より高い一貫性、より高い忠実度です。

興味のあるご家族はすぐにお試しいただけます。

<<:  プログラマーから見たChatGPT

>>:  OpenAI取締役会の爆発的な活動が暴露される!投資家は訴訟の準備をしている、ネットユーザー:GPT-4はあなたよりも人を解雇するのが得意

ブログ    

推薦する

目から涙が溢れてきました!ビクーニャのデジタルツインは10年前の自分を再現し、10年間の対話は数え切れないほどの人々に影響を与えた

Reddit のネットユーザーが何か新しいことをやっている。彼は、自身のオンラインフットプリントデー...

言語は「絆」であり、イメージバインドを超えて、さまざまなモードでパンチとキックを行う

北京大学とテンセントがマルチモーダル15角形の戦士を制作しました!言語を中心に据えて、ビデオ、オーデ...

Facebook の MusicGen を使用してテキストを音楽に変換する方法

翻訳者 |ブガッティレビュー | Chonglou MusicGen を使用すると、誰でもテキスト ...

GenAIは将来のインシデント管理プロセスを形作っています

回答者の大多数 (59.4%) は明確なインシデント管理プロセスを導入しており、自動化のレベルはニー...

人工知能がプログラマーに取って代わるまでにはどれくらい時間がかかるのでしょうか?

予測によると、AI の影響を最も受ける職業の 1 つはアプリケーション開発者です。結局のところ、Ch...

マスク氏、マイクロソフトを非難「OpenAIはあなたのツールではない」

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

工業情報化部:チップやオペレーティングシステムなどのトップレベルの基盤にブレークスルーがなければ、AI業界は空中楼閣になるだろう

12月17日、浙江省徳清国際会議センターで2019年中国スマート企業発展フォーラムが開催され、工業情...

ワンクリックで 2D GAN を「3D」化、CUHK が教師なし 3D 再構築の新しい方法を提案

CUHK の MMLab チームによるこの研究は、2 次元 GAN がオブジェクトの 3 次元構造を...

ファーウェイがAI戦略とフルスタックの全シナリオAIソリューションを発表

[中国、上海、2018年10月10日] 第3回HUAWEI CONNECT 2018(ファーウェイ・...

PyTorch モデルのトレーニングを高速化するための 9 つのヒント!

[[353240]]ニューラルネットワークをこのようにしないでください正直に言えば、あなたのモデル...

JD.com がオープンソースの顔認識ツールキットを公開: 最も強力なモデルをカバーし、トレーニングとスコアの実行をサポート

近年、ディープラーニングをベースとした顔認識技術は大きな進歩を遂げています。しかし、顔認識モデルの実...

...

...

成都初の無人地下鉄が運行開始。列車の前方からの眺めはまるで時空を旅しているかのようだ

毎日地下鉄に乗るとき、トンネルを高速で走る列車の前方風景を見たことがありますか?11月13日、成都初...