戻れる幼少時代!快手が「子供になる」特殊効果をリリース

戻れる幼少時代!快手が「子供になる」特殊効果をリリース

「子供時代に戻りたい。子供の頃はよく食べて、よく寝て、あまり考えないことが好きだった」。山西省大同市の快手ユーザー「詩と距離」は、快手の「子供になる」マジックウォッチを体験した後に投稿した動画の下にこのように書いた。

本日(14日)、Kuaishou APPは「子供になる」という魔法表現をリリースしました。撮影インターフェースでこの魔法表現を選択すると、子供になるという特殊効果を体験できます。生成技術を活用したこの魔法の時計は、非常に強い現実感を持っています。マジックウォッチはあらゆるiOSおよびAndroidデバイスと互換性があり、ほとんどの携帯電話モデルで赤ちゃんの顔のビデオバージョンのリアルタイム生成をサポートしていることがわかっています。

[[273795]]

現実感がとても強い。快手に来て子供の頃に戻りましょう

記者は「子供に変身する」という魔法の表現を体験し、リアルタイムアルゴリズムが安定して動作し、リアルタイムの顔の動きや顔と髪の境界のレンダリングが非常にリアルで自然で、携帯電話がインターネットに接続されていないときでも「赤ちゃんの顔」をリアルタイムで生成できることを発見しました。快手製品スタッフによると、この特殊効果を開発した目的は、テクノロジーを通じてユーザーが子供の頃の楽しさを思い出せるようにすることだという。リアルタイム特殊効果は、基本的にすべての携帯電話モデルをカバーしている。「大多数のモデルをカバーすることはエンジニアにとって大きな挑戦ですが、それでも私たちは、この楽しい魔法の時計をもっと多くの一般の人々に体験してもらえることを願っています。」

[[273796]]

舞台裏:Kuaishouが中国初のリアルタイムGANを開発

快手が開発した「子供に変身」魔法表現の開発を担当したエンジニアによると、この特殊効果はディープラーニングの敵対的生成ネットワーク(GAN)に基づいており、快手が蓄積した大規模なデータセットとカスタマイズされたモデル圧縮技術を組み合わせることで、携帯電話でリアルタイムの効果を実現しているという。「これは確かに大きな挑戦です。Androidでリアルタイム実装を実現した企業は他にありません。」

この効果を「携帯電話で」実現するということは、データを処理するためにサーバーに送信する必要がなく、携帯電話で処理されることを意味します。 ユーザーの携帯電話は、プレイするためにインターネットに接続する必要がないため、データをサーバーに送信して処理し、それを携帯電話に送り返す時間を節約できます。 この「コンピューティング集約型」のゲームプレイはほとんどのモデルをカバーでき、Kuaishou が独自に開発した YCNN ディープラーニング推論エンジンと Kuaishou が独自に開発したカスタマイズされたモデル圧縮アルゴリズムと切り離すことはできません。これら 2 つのテクノロジーにより、さまざまな価格帯の携帯電話モデルが AI とビッグデータによってもたらされる技術的利益を享受できるようになり、Kuaishou の包括的な価値がサポートされます。

近年、ディープラーニング研究の分野では、生成的敵対的ネットワーク(GAN)がさまざまな問題の解決に広く利用されています。中国では、快手が携帯電話にこの技術を実装した最初の企業の1つです。

<<:  ガートナー: 2019 年新興テクノロジー ハイプ サイクル

>>:  人工知能でカスタマーサービスエージェントを強化する方法

ブログ    
ブログ    

推薦する

自動運転のための不確実性を考慮した動作計画:強化学習ベースのアプローチ

[[429196]] 2021年10月1日にarXivにアップロードされた論文「強化学習を使用した不...

LexisNexisが生成AIの課題に挑む

生成型 AI の破壊的な脅威から抜け出す方法を模索している IT リーダーは、LexisNexis ...

チューリング賞受賞者ジョン・ヘネシー氏:データと機械学習は世界をより良い場所にする

5月26日、チューリング賞受賞者で米国工学アカデミー会員のジョン・ヘネシー氏が、2021年中国国際ビ...

Ctrip旅行言語モデルシステムの紹介と応用

著者についてCtrip の自然言語処理と大規模言語モデル アルゴリズムの専門家である Terry は...

機械学習の成功事例5つ

IT リーダーが、人工知能と機械学習を使用してビジネス上の洞察を得る方法を共有します。組織が顧客の好...

1760億のパラメータを持つBLOOMZの推論、パフォーマンスレイテンシはわずか3.7秒

大規模言語モデル (LLM) のサイズが大きくなるにつれて、これらのモデルを本番環境で推論に導入して...

安全で制御可能、かつ法的に準拠した人工知能は金融分野で「原則化」されている

現在、国内の新興デジタルインフラの進歩と、5G、クラウドコンピューティング、ビッグデータなどのモジュ...

直接的な選好最適化戦略を用いたミストラル7bモデルの微調整

翻訳者|朱 仙中レビュー | Chonglou導入通常、事前トレーニング済みの大規模言語モデル (L...

工業生産は変化している:機械は人間よりも製造に優れている

最近、ロボットが人気になってきました。家庭生活、ホテル経営、学校教育、医療などさまざまな場面でロボッ...

スマートカーのステアバイワイヤ技術の詳細な説明

電動化とインテリジェント化という2つの大きな発展の流れの下、わが国は機能車からスマート車への転換点に...

AI アバターが CES に登場! Samsung の Neon チャットボットは学習、進化、記憶が可能です!

サムスンの待望のスマートヒューマンプロジェクト「Neon」が、ついにCES 2020でデビューしまし...

...

...

最新の NaViT モデルは最高です!あらゆるアスペクト比と解像度に対応する強力なトランスフォーマー

本日は、あらゆるアスペクト比と解像度で動作する Transformer モデルである NaViT を...

2GBのDAYU200に大規模な言語モデルをローカルにデプロイする

実装のアイデアと手順軽量 LLM モデル推論フレームワーク InferLLM を OpenHarmo...