TikTokの背後にあるAIの仕組み

エンジニアの視点から TikTok 推奨システムのアーキテクチャを探ります。

TikTok は、ユーザーが短い動画を作成して共有できる動画共有アプリです。パーソナライズされた「あなただけのための」おすすめでユーザーに感動を与えます。 Z世代の間で非常に人気があり、中毒性があります。その背後には人工知能技術が動いています。

TikTok アーキテクチャ

TikTok の推奨システムのアーキテクチャは、ビッグデータフレームワーク、機械学習、マイクロサービスアーキテクチャの 3 つのコンポーネントで構成されています。

ビッグデータフレームワークはシステムの出発点です。リアルタイムのデータストリーム処理、データ計算、およびデータストレージを提供します。
機械学習はレコメンデーションシステムの頭脳です。さまざまな機械学習およびディープラーニングのアルゴリズムとテクニックを使用してモデルを構築し、個人の好みに合わせた推奨事項を生成します。
マイクロサービスアーキテクチャは、システム全体が迅速かつ効率的にサービスを提供できるようにする基盤となるインフラストラクチャです。

ビッグデータフレームワーク

データがなければ、インテリジェンスは存在しません。

分析されるデータのほとんどはユーザーのスマートフォンから取得されます。これには、オペレーティングシステムやインストールされているアプリケーションなどが含まれます。さらに、TikTok は、視聴時間、スワイプ、いいね、共有、コメントなどのユーザーのアクティビティログに特別な注意を払います。

ログデータは Flume と Scribe を通じて収集および集約されます。それらは Kafka キューにパイプされます。その後、Apache Storm は Apache Hadoop エコシステム内の他のコンポーネントを使用して、データストリームをリアルタイムで処理します。

Apache Hadoop エコシステムは、第 1 世代の分散データ処理システムである MapReduce を含む、データ処理およびストレージ用の分散システムです。バッチ処理と並行してデータを処理します。 YARN は、ジョブのスケジューリングとクラスターリソース管理のためのフレームワークです。 HDFS は分散ファイルシステムです。 HBase は、大規模なテーブルの構造化データストレージをサポートするスケーラブルな分散データベースです。 Hive は、データの要約とクエリを提供するデータウェアハウスインフラストラクチャです。 Zookeeper は高性能なコーディネーションサービスです。

データ量が急速に増加するにつれて、リアルタイムのデータ処理フレームワークが登場します。 Apache Spark は、ビッグデータワークロードのほぼリアルタイムの分散処理を可能にする第 3 世代のフレームワークです。 Spark はメモリ内で処理することで MapReduce のパフォーマンスを向上させます。過去数年間、TikTok は第 4 世代のフレームワーク Flink を適用してきました。リアルタイムストリーミングをネイティブに実行するように設計されています。

データベースシステムには、MySQL、MongoDB などがあります。

機械学習

これが、TikTok がパーソナライズされた中毒性のあるアルゴリズムで有名になった理由の中心です。

大量のデータセットが入力された後、次のステップはコンテンツ分析、ユーザー分析、コンテキスト分析です。 TensorFlow などのニューラルネットワークディープラーニングフレームワークは、コンピュータービジョンとネイティブ言語処理 (NLP) を実行するために使用されます。コンピュータービジョンは写真やビデオを使用して画像を解釈します。 NLP には、分類、ラベル付け、評価が含まれます。

ロジスティック回帰 (LR)、畳み込みニューラルネットワーク (CNN)、再帰型ニューラルネットワーク (RNN)、勾配ブースティング決定木 (GBDT) などの従来の機械学習アルゴリズムを使用します。コンテンツベースフィルタリング (CBF)、協調フィルタリング (CF)、さらに高度な行列分解 (MF) などの一般的な推奨方法を適用します。

TikTok があなたの心を読むための秘密兵器は次のとおりです。

1. アルゴリズム実験プラットフォーム：エンジニアは、LR や DNN などの複数の機械学習アルゴリズムを組み合わせて実験し、テスト (A/B テスト) を実行して調整を行います。

2. 幅広いカテゴリとタグ:これらのモデルは、視聴時間、スワイプ、多くの場合は「いいね」や「シェア」などのユーザーエンゲージメントに基づいています (潜在意識は、あなたが言うことよりもあなたがすることの方があなたについて多くを語っていることを反映しています)。ユーザーの特徴、ベクトル、カテゴリの数は、世界中のほとんどのレコメンデーションシステムを上回っており、現在も増加し続けています。

3. ユーザーフィードバックエンジン:複数の反復でユーザーフィードバックを取得した後、モデルを更新します。エクスペリエンス管理プラットフォームはこのエンジン上に構築されており、最終的には条件と推奨事項が改善されます。

推奨事項のコールドスタート問題に対処するために、リコール戦略が使用されます。人気があり高品質であることが証明された数千万本のビデオの中から、数千本の候補が選ばれます。

一方、超高速応答を可能にするために、一部の AI 作業はクライアント側に移行しました。これには、デバイス上で実行されるリアルタイムのトレーニング、モデリング、推論が含まれます。クライアント側では、TensorFlow Lite や ByteNN などの機械学習フレームワークが使用されます。

マイクロサービスアーキテクチャ

TikTok はすでにクラウドネイティブインフラストラクチャを使用しています。ユーザー分析、予測、コールドスタート、リコール、ユーザーフィードバックエンジンなどの推奨コンポーネントが API として使用されます。これらのサービスは、Amazon AWS や Microsoft Azure などのクラウドでホストされます。このシステムにより、ビデオキュレーションがクラウドを通じてユーザーにプッシュされるようになります。

TikTok は Kubernetes をベースとしたコンテナ化技術を使用しています。 Kubernetes はコンテナオーケストレーターとして知られています。これは、アプリケーションのライフサイクルを自動化するためのツールセットです。 Kubeflow は、Kubernetes 上で機械学習ワークフローをデプロイすることに専念しています。

クラウドネイティブスタックの一部であるサービスメッシュは、サービス間通信を処理するもう 1 つのツールです。アプリケーションのさまざまな部分が相互にデータを共有する方法を制御します。アプリケーション層ではなく、プラットフォーム層に機能やサービスを挿入します。

高い同時実行要件のため、このサービスは Go 言語と gRPC を使用して構築されています。 TikTok では、優れた組み込みネットワークと並行処理のサポートにより、Go がサービス開発の主要言語となっています。 gRPC は、サービスを効率的に構築および接続するためのリモートプロセス制御フレームワークです。

Tiktok の成功は、最高のユーザーエクスペリエンスを提供するために全力を尽くしている点にあります。低レベル (システムレベル) のパフォーマンスを最大化するための内部ツールを構築します。たとえば、ByteMesh は Service Mesh の改良版、KiteX は高性能な Golang gRPC フレームワーク、Sonic は拡張された Golang JSON ライブラリです。その他の内部ツールまたはシステムには、パラメータサーバー、ByteNN、abase などがあります。

TikTokの機械学習責任者であるXiang Liang氏は、時には上位の（機械学習）アルゴリズムよりも下位のインフラストラクチャの方が重要になることがある、と述べた。

翻訳者紹介

朱剛、51CTOコミュニティ編集者、2021年IT影響力のある専門家ブロガー、Alibaba Cloud専門家ブロガー、2019年CSDNブログスタートップ20、2020年Tencent Cloud +コミュニティ優秀著者、11年間の最前線開発経験を持ち、ヘッドハンティングサービスのウェブサイトアーキテクチャ、エンタープライズインテリジェントカスタマーサービス、大規模電子政府システム開発の設計に参加し、大手国有企業の内部漏洩防止および電子文書セキュリティ監視システムの構築を主導しました。現在は北京途家健康で医療ソフトウェアの研究開発に従事しています。

原題: How the AI Behind TikTok Works 、著者: Vivien H.

<<: エンタープライズ AI プラットフォーム選択ガイド

>>: ディープラーニングにおける正規化技術の包括的な概要