独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

2013年頃、Kuaishouは純粋なツールアプリケーションから、毎日1万人のアクティブユーザーを抱える短編動画コミュニティへと徐々に変化しました。 2018年12月現在、快手には1日あたり1億6000万人以上のアクティブユーザーと3億人の月間アクティブユーザーがおり、毎日1500万本以上の短編動画がアップロードされ、80億本以上の短編動画が保管されています。 Kuaishouが短期間でこのような成果を達成できたのは、独自のロジックと堅実なAI技術によるものです。

快手ショート動画のロジックは非常にユニークで、公平性とアクセシビリティ、一般動画制作者の保護、撮影内容と視聴ニーズの多様性という4つの部分のクローズドループを巧みに構築しています。

「Kmoji」の魔法のような表情を支えるAI技術

かわいい魔法の絵文字がKuaishouでリリースされて以来、大多数のユーザーに好評を得ていると報告されています。この機能により、ユーザーはカメラを使用して自分専用の顔AR仮想画像を生成すると同時に、ユーザーの表情を捉え、まばたき、口を開ける、眉を上げる、舌を出すなどの微妙な動きを正確に再現することができます。

ユーザーがかわいいKmojiを使って作った手作りのGeng画像

「Kmoji」の背後には、Kuaishou 技術チームによる多くの研究開発作業があります。まず、「Kmoji」は顔のキーポイントや画像特徴抽出などのAI技術を基盤としており、iPhoneXなどのデバイスがサポートする3D構造化光情報を必要としません。2D視覚情報のみでユーザーの髪型、顔の形、顔の特徴、肌の色、口紅の色、ひげなどの顔の属性情報を認識し、ユーザー固有の3D AR画像を構築し、その3D画像を操作して表情パラメータを通じてさまざまな微妙な表情を作ります。例えば、笑う、目を閉じる、口を開ける、舌を出すなど、50以上の表情を作ります。これはマルチモーダル技術の成功した応用です。

さらに、「Kmoji Cute Face」は物理ベースのリアルなレンダリングアルゴリズムを採用しており、金属や革などのモデル素材をよりリアルで質感のあるものにし、モデルの表現力を大幅に向上させています。同時に、Kuaishou技術チームはアルゴリズムの最適化を通じて「Kmoji」の実行に占有されるCPUとGPUリソ​​ースを大幅に削減し、動作効率を向上させ、一般的な千元クラスの携帯電話でもスムーズに動作できるようになりました。

快手コンテンツ制作におけるAI技術の応用

Kuaishouは、顔のキーポイント認識、体のキーポイント認識、ジェスチャー認識、視覚慣性オドメトリ、髪のセグメンテーション、背景のセグメンテーションなどの人工知能技術を使用して、美容装飾効果、ダンスマシンゲーム、雨制御効果、AR効果、髪の染色効果、背景の置き換えなどの魔法のような表現を実現し、ユーザーに新しい録画体験をもたらします。

快手はまた、写真やビデオに映る手の位置や21個の主要関節の位置を識別できる手のキーポイント技術を独自に開発しました。この技術ソリューションは、あらゆるジェスチャーの重要なポイントの予測をサポートすると同時に、革新的なネットワーク設計を採用しているため、モデル計算の量が大幅に削減され、iPhone と Android フォンの両方でリアルタイムに監視できます。業界で同様の機能を備えたソフトウェア プラットフォームは他にありません。

コンテンツ制作に AI 技術を適用することが難しいのは、Kuaishou のユーザー カバレッジが非常に広いためです。不完全な統計によると、Kuaishouユーザーが使用している携帯電話のモデルは5万以上あり、これらの携帯電話の多くは比較的性能が限られています。高度なAI技術には、デバイスに非常に高い計算能力が必要です。より多くのユーザーが高度な技術を体験できるように、Kuaishouは基盤となるプラットフォームをカスタマイズし、独自のYCNN深層推論学習エンジンを開発しました。これにより、AI テクノロジの動作がユーザー デバイスの計算能力によって制限されるという問題が解決されます。評価によると、Kuaishou YCNN は既知のエンジンよりも 50% 高速に実行されます。

報道によると、2018年12月、快手YCNN深層推論学習エンジンは、人工知能技術メディア[Machine Heart]が創設したSynced Machine Intelligence Awards 2018「トップ30ベストAI応用事例」賞を受賞した。

過去2年間で、短編動画の人気は爆発的に高まり、インターネットメディアの発展のトレンドをリードし、急速に競争の激しい業界になりました。 2019年1月10日、中国インターネット視聴覚番組サービス協会は、ショートビデオの配信手順をさらに標準化するために、「オンラインショートビデオコンテンツ審査基準の詳細規則」と「オンラインショートビデオプラットフォーム管理基準」の100条を正式に発表しました。これにより、一部の製品コンテンツのアップグレードが促進され、一部の企業が他社を追い抜く絶好の時期でもあります。おそらく、このような政策監督の下では、すべてのショートビデオ企業はコンテンツの品質にもっと注意を払うようになるでしょう。Kuaishouが独自のロジックを堅持し、より多くのAI技術を統合して最高のユーザーエクスペリエンスを生み出し、さらに前進することを願っています。

<<:  Kmojiの魔法の表情を支えるAI技術

>>:  2018年の世界人工知能データから将来の発展傾向を見る

ブログ    
ブログ    

推薦する

マルチタスクでSOTA、UBCを実現 Googleなどが3Dポイントクラウド向けの教師なしカプセルネットワークを提案

これは、3D ポイント クラウド用に提案された教師なしカプセル アーキテクチャであり、3D ポイント...

ディープラーニングにも格闘技カンファレンスがある! 8つのテクノロジーの巨人:私の学派はAGIを実現できる

[[426161]]ディープラーニングの研究は格闘技の競技のようなものですか?意外なことに、何でもや...

マスク氏:プログラマーの62%が人工知能が武器化されると考えている

常に人工知能の脅威論を支持してきたシリコンバレーの「鉄人」マスク氏は、今回、プログラマーたちの間で支...

人工知能はこれら12の分野に混乱をもたらし、ホワイトカラー労働者も職を失うことになるだろう

[[192649]]人工知能 (AI) は、今日最もエキサイティングで将来有望な最先端技術の 1 つ...

李開復、胡宇、張亜琴の GMIC 2018 対談: AI 戦略と AI 人材育成における中国と米国の違いは何ですか?

[[227402]]人工知能が急成長を遂げている現在、AI人材の不足は中国だけでなく、世界全体が直...

AIが労働力に与える影響について考えられる3つのシナリオ

「生成AIは、農業革命と産業革命以来、労働力に最も大きな変化をもたらす可能性があります。」まあ、あま...

人工知能は視覚効果アーティストの役割に取って代わるでしょうか?

視覚効果 (VFX) の分野における AI の統合は、シームレスでデータ主導のアプローチを導入するこ...

【ビッグネームがやってくる 第12話】eスポーツデータ処理プラットフォームにおけるAIとビッグデータシステムの応用

[51CTO.comより引用] eスポーツは近年最も急速に発展した競技スポーツのユニークな分野として...

ディープラーニングの一般化能力についての簡単な議論

1. DNNの一般化能力に関する問題この論文では主に、過剰パラメータ化されたニューラル ネットワー...

職場におけるAIと自動化の重要性

AI は問題解決に新たな次元をもたらし、さまざまな業界の企業に利益をもたらします。 AI は、膨大な...

張亜琴氏と張宏江氏は人工知能の将来について何を語っているのでしょうか?

「大規模なシステムを構築するには、体系的な思考、実践的なスキル、システム構築への愛情を持った人材が...

...

Facebook の応用機械学習チームを訪問: 研究と応用の間に橋を架けるにはどうすればよいでしょうか?

Facebook では、応用機械学習チームがソーシャル ネットワークの視覚、会話、理解を支援してお...

...

音声認識技術の開発と応用の概要

[[280529]] [51CTO.com クイック翻訳] コミュニケーションは私たちの生活において...