独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

独自のロジックと優れた AI テクノロジーを備えた Kuaishou は、1 日あたり 1 億 6,000 万人のアクティブ ユーザーと 1 日あたり 1,500 万件を超えるアップロードを誇ります。

2013年頃、Kuaishouは純粋なツールアプリケーションから、毎日1万人のアクティブユーザーを抱える短編動画コミュニティへと徐々に変化しました。 2018年12月現在、快手には1日あたり1億6000万人以上のアクティブユーザーと3億人の月間アクティブユーザーがおり、毎日1500万本以上の短編動画がアップロードされ、80億本以上の短編動画が保管されています。 Kuaishouが短期間でこのような成果を達成できたのは、独自のロジックと堅実なAI技術によるものです。

快手ショート動画のロジックは非常にユニークで、公平性とアクセシビリティ、一般動画制作者の保護、撮影内容と視聴ニーズの多様性という4つの部分のクローズドループを巧みに構築しています。

「Kmoji」の魔法のような表情を支えるAI技術

かわいい魔法の絵文字がKuaishouでリリースされて以来、大多数のユーザーに好評を得ていると報告されています。この機能により、ユーザーはカメラを使用して自分専用の顔AR仮想画像を生成すると同時に、ユーザーの表情を捉え、まばたき、口を開ける、眉を上げる、舌を出すなどの微妙な動きを正確に再現することができます。

ユーザーがかわいいKmojiを使って作った手作りのGeng画像

「Kmoji」の背後には、Kuaishou 技術チームによる多くの研究開発作業があります。まず、「Kmoji」は顔のキーポイントや画像特徴抽出などのAI技術を基盤としており、iPhoneXなどのデバイスがサポートする3D構造化光情報を必要としません。2D視覚情報のみでユーザーの髪型、顔の形、顔の特徴、肌の色、口紅の色、ひげなどの顔の属性情報を認識し、ユーザー固有の3D AR画像を構築し、その3D画像を操作して表情パラメータを通じてさまざまな微妙な表情を作ります。例えば、笑う、目を閉じる、口を開ける、舌を出すなど、50以上の表情を作ります。これはマルチモーダル技術の成功した応用です。

さらに、「Kmoji Cute Face」は物理ベースのリアルなレンダリングアルゴリズムを採用しており、金属や革などのモデル素材をよりリアルで質感のあるものにし、モデルの表現力を大幅に向上させています。同時に、Kuaishou技術チームはアルゴリズムの最適化を通じて「Kmoji」の実行に占有されるCPUとGPUリソ​​ースを大幅に削減し、動作効率を向上させ、一般的な千元クラスの携帯電話でもスムーズに動作できるようになりました。

快手コンテンツ制作におけるAI技術の応用

Kuaishouは、顔のキーポイント認識、体のキーポイント認識、ジェスチャー認識、視覚慣性オドメトリ、髪のセグメンテーション、背景のセグメンテーションなどの人工知能技術を使用して、美容装飾効果、ダンスマシンゲーム、雨制御効果、AR効果、髪の染色効果、背景の置き換えなどの魔法のような表現を実現し、ユーザーに新しい録画体験をもたらします。

快手はまた、写真やビデオに映る手の位置や21個の主要関節の位置を識別できる手のキーポイント技術を独自に開発しました。この技術ソリューションは、あらゆるジェスチャーの重要なポイントの予測をサポートすると同時に、革新的なネットワーク設計を採用しているため、モデル計算の量が大幅に削減され、iPhone と Android フォンの両方でリアルタイムに監視できます。業界で同様の機能を備えたソフトウェア プラットフォームは他にありません。

コンテンツ制作に AI 技術を適用することが難しいのは、Kuaishou のユーザー カバレッジが非常に広いためです。不完全な統計によると、Kuaishouユーザーが使用している携帯電話のモデルは5万以上あり、これらの携帯電話の多くは比較的性能が限られています。高度なAI技術には、デバイスに非常に高い計算能力が必要です。より多くのユーザーが高度な技術を体験できるように、Kuaishouは基盤となるプラットフォームをカスタマイズし、独自のYCNN深層推論学習エンジンを開発しました。これにより、AI テクノロジの動作がユーザー デバイスの計算能力によって制限されるという問題が解決されます。評価によると、Kuaishou YCNN は既知のエンジンよりも 50% 高速に実行されます。

報道によると、2018年12月、快手YCNN深層推論学習エンジンは、人工知能技術メディア[Machine Heart]が創設したSynced Machine Intelligence Awards 2018「トップ30ベストAI応用事例」賞を受賞した。

過去2年間で、短編動画の人気は爆発的に高まり、インターネットメディアの発展のトレンドをリードし、急速に競争の激しい業界になりました。 2019年1月10日、中国インターネット視聴覚番組サービス協会は、ショートビデオの配信手順をさらに標準化するために、「オンラインショートビデオコンテンツ審査基準の詳細規則」と「オンラインショートビデオプラットフォーム管理基準」の100条を正式に発表しました。これにより、一部の製品コンテンツのアップグレードが促進され、一部の企業が他社を追い抜く絶好の時期でもあります。おそらく、このような政策監督の下では、すべてのショートビデオ企業はコンテンツの品質にもっと注意を払うようになるでしょう。Kuaishouが独自のロジックを堅持し、より多くのAI技術を統合して最高のユーザーエクスペリエンスを生み出し、さらに前進することを願っています。

<<:  Kmojiの魔法の表情を支えるAI技術

>>:  2018年の世界人工知能データから将来の発展傾向を見る

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ReLU がビジュアル Transformer のソフトマックスに取って代わり、DeepMind の新しい手法でコストが急速に削減される

Transformer アーキテクチャは、現代の機械学習で広く使用されています。 Attention...

顔認識は普及しつつあるのに、なぜ禁止されているのでしょうか?

顔認識は誰もが知っている技術です。iPhoneのFace IDからAlipayの顔認証決済まで、かつ...

ビッグデータ、人工知能、そして法曹界の未来

私は人工知能と法曹界の将来について数多くの講演を行ってきました。過去2年間、AlphaGo Zero...

AIをうまく活用したいなら、この2つの問題を早急に解決しなければなりません!

[[441323]]早すぎるオールインデータ文化を一夜にして構築することはできないのと同様に、分析...

大規模な伝染病に直面した時、ロボットは何ができるでしょうか?

ウイルスのさらなる拡散を防ぐため、米国で初めて新型肺炎に感染した患者は隔離室に隔離され、治療中はロボ...

Sitechiのスマートオペレーションプラットフォームは、スマートシティが4.0時代に入ることを支援します

現在、中国ではデジタル経済の波が高まっています。情報技術を都市計画や建設とどのように融合させ、都市情...

...

ビル・ゲイツ:ロボットへの課税は人間の雇用創出のために推進される

[[248841]]マイクロソフトの創業者で、現在は自身の財団を通じて慈善事業にも取り組んでいるビル...

SMIC、AIoT時代の最も価値ある製造業である14nmプロセスチップを量産

SMICは最近、研究開発への投資を増やすことで14nmプロセスチップを量産し、2021年に正式に出荷...

...

...

人工知能アプリケーションのための6つの主要技術、ついに誰かがわかりやすく説明

[[338620]]画像はPexelsよりこの記事はWeChatの公開アカウント「Big Data ...

[GPT-4理論] GPT-4のコア技術を探る

序文GPT-4はリリースされてからしばらく経ちますが、セキュリティなどのさまざまな理由から、Open...

Testin Cloud Testingは、ビッグモデル+ソフトウェアテストの業界リーダーの技術革新の道を模索し始めました。

情報技術が急速に発展する時代において、ソフトウェア業界は活況を呈しており、高品質のソフトウェアに対す...

2月10日に職場復帰ラッシュが到来し、北京は「急速AI温度検出器」の配備を開始した。

新型コロナウイルスによる肺炎の流行は依然として続いており、中国のさまざまな省や市では2月10日に大規...