人工知能の次の段階として、なぜインターネットの巨人に期待すべきなのでしょうか?

過去10年間を振り返ると、人工知能の進歩は「目覚ましい」ものと言えます。特に2015年にAlphaGoが登場して以来、人工知能業界の発展スピードは非常に速くなっています。結局、人工知能の分野で50年以上の探究を経て、人類は半導体技術とソフトウェア技術の助けを借りて、機械学習の分野でようやくブレークスルーを達成したのです。

2015年以来、人工知能業界の発展テーマは機械学習のブレークスルーの「小さな道」を広げることになりました。セキュリティ監視、証券自動取引、テキスト翻訳など、多くの分野で人工知能の「覚醒」が始まりました。これは、セキュリティ監視データはすべて画像であり、証券業界自体がデジタルゲームであり、人類の歴史の中で翻訳された本が数え切れないほどあることと、それらのデータ属性に大きく関係しています。

しかし、時が経つにつれて、人々の見方は変わり始め、ますます多くの応用シナリオにおいて、データが人工知能を妨げる最大の要因となってきました。まず、ますます複雑化する人工知能に必要なデータの量は急増しています。次に、データサイロとデータプライバシーの問題は、現実的には解決が困難です。

これは、人工知能業界と、人工知能の助けを借りてアップグレードを緊急に必要としているさまざまな業界にとって避けられない課題です。次の段階のスマート産業は、さまざまなデータ制約の下で前進する方法を見つけなければなりません。

現在、業界で最も信頼性の高いソリューションとして認識されているのは「フェデレーテッドラーニング」です。機械学習と他のデータ技術を組み合わせることで、複数のデータ特性を連携させ、コンピューターによって完全に制御され、データ価値を効率的にマイニングするシステムが構築されます。

テンセントセキュリティが最近リリースした「Federated Learning Application Service（FLAS）」は、国内の「Federated Learning」技術の応用分野における最新の成果である。 FLAS は、低コストで高速な反復共同モデリングサービスを通じて、すべての参加者のプライバシーを保護しながら、すべての関係者のビッグデータの生産性を効果的に解き放ち、ビジネスイノベーションのアプリケーションシナリオに幅広く適用できます。

データは、現在の人工知能開発における「暗いハードル」である

機械学習の道において、データは常に非常に重要な役割を果たしてきました。さまざまなアプリケーションシナリオには多くの違いがありますが、一貫している点が 2 つあります。それは、データが多いほど良いこと、データの次元が多いほど良いことです。

データ量に対する需要は、AlphaGo を見れば明らかです。Google の DeepMind は、あらゆる面で人間を凌駕する最強の囲碁人工知能、Alpha Zero の開発に合計 2 年を費やしました。 16万の人間のチェスゲームデータを使用して初心者のプロプレイヤーに勝つことができた初期のAlphaGoと比較すると、Alpha Zeroは人間と機械が生成したものを含む286億のチェスゲームデータを使用しており、その差は1万8000倍です。

[[374385]]

データの次元も非常に重要です。囲碁は確かに困難なゲームですが、実際にゲームが行われるのは、半メートル四方の、白と黒の駒が 16 行 16 列しかないチェス盤の上で行われます。現実の問題と比較すると、Go はあまりにも「単純」であるため、現実の問題を解決するプロセスでは、単純なシナリオの数倍のデータ次元が頻繁に使用されます。

データ要件の観点から見ると、人工知能の応用では、必要な量と次元のデータを集め、十分な計算能力を使用してそれらを実行可能なニューラルネットワークに変換する必要があることは明らかです。残念ながら、そのような操作は非現実的です。

現実世界では、人工知能に必要なデータのほとんどは「データアイランド」の形で分散しています。業界、企業、さらには部門間にも、実際の「データ格差」が存在します。デジタル運用の過程で生成される新しいタイプの資産の場合、ユーザーのプライバシーの問題は言うまでもなく、各エンティティのデータは貴重です。

近年、ますます厳格化するデータ規制も大きな課題をもたらしています。2018年、欧州連合は、企業によるユーザーデータの使用について詳細かつ包括的な規定を設けた新しい法案、一般データ保護規則（GDPR）の制定を主導しました。次は企業に対する実際の処罰です。 2019年9月24日現在、欧州22のデータ規制当局が87件のケースで総額3億7000万ユーロの行政罰を決定している。

中国はまた、2017年に「中華人民共和国サイバーセキュリティ法」と「中華人民共和国民法通則」を施行し、ネットワーク事業者が収集した個人情報を開示、改ざん、破壊してはならないことを明確に規定した。同時に、新たな「個人情報保護法」や「情報セキュリティ法」も、草案から法案化に向けて動き出している。これらの新しいデータ規制の実施は、必然的に人工知能データの収集と使用に直接的な影響を及ぼすことになります。

さまざまな現実の状況により、人工知能技術の実装の道のりは、初期のコア技術主導から、アプリケーションにおける現実の問題の解決、つまり既存の人工知能データの問題を克服する方法へと変化しました。

実際、人工知能業界は早くから「連合学習」というソリューションを提供してきました。これは、人工知能機械学習の基本的なコア機能と、一連のデータ技術およびシステムロジックアーキテクチャを組み合わせて、体系的なソリューションを作成するというものです。追加のコンピューティング能力とネットワークリソースを活用することで、元のデータがローカルマシンから出ることなく、実際の適用効果がデータを直接集約する機械学習に近くなるようにしながら、複数の当事者からのデータの価値を集約できます。

フェデレーテッドラーニングアプリケーションサービスは、銀行業界が現実世界の問題を解決するのに役立ちます

実際のアプリケーションでは、金融業界が連合学習アプリケーションサービスの主要な着地点となっています。銀行やその他の金融機関は、金融取引やさまざまな金融サービスを提供する商業機関として、データ統合の難しさという問題に長い間直面してきました。これらの機関にはデータが不足しているわけではありません。ただし、これらのデータのほとんどは、比較的単一の次元を持つユーザートランザクションデータであるため、データの価値をマイニングすることが困難です。

クレジットカードの使用における不正行為やリスク警告を特定する場合でも、ビジネス開発を促進するためにユーザーに具体的なマーケティング推奨事項を提供する場合でも、最終的なサービス対象は実際の人間の顧客です。後者は、実際に社会、消費、金融、空間など、現実の生活におけるさまざまなデータを安定して生成します。銀行の顧客の価値をより有効に引き出すには、さまざまなカテゴリのデータをすべて分析し、顧客を総合的に理解する必要があります。

複数の業界にわたって、ユーザーのプライバシーリスクが発生する可能性が高く、これは明らかに、フェデレーテッドラーニングがその能力を発揮するのに最適な段階です。 Tencent Security の最新の「Tencent Security Federated Learning Application Service」は、フェデレーテッドラーニングアプリケーションの分野における最新かつ最も有望な「ダンサー」です。

Tencent Security Federated Learning Application Service は、典型的な垂直連合学習ソリューションです。このタイプのソリューションは、複数の機関による同じサンプルの異なる観察を統合して AI 共同モデリングを実行し、最終的に銀行、電子商取引などの異種データを持つ機関向けの共同モデリングサービスセットを形成します。この一連のアプリケーションサービスを採用することで、最終データによって提供されるユーザーのプライバシーが保証され、すべての関係者のデータセキュリティがより信頼できるようになり、同時にビッグデータの生産性が最大限に発揮されます。

多くのユーザー応用分野をカバーするインターネット大手企業として、また「フェデレーテッドラーニング」自体の最先端の技術的特徴として、Tencent Security のフェデレーテッドラーニング応用サービスは、当初から現在のさまざまなフェデレーテッドラーニングプロジェクトとは異なる特徴を持っています。

1つ目は「経験」です。テンセントの自社製品とサービスのおかげで、テンセントセキュリティは過去20年間でブラックとグレーの業界の大規模なデータベースを蓄積し、数百億のポイントと数千億のエッジを含むブラックとグレーの業界知識グラフを形成しました。セキュリティサービスは中国のネットユーザーの99％をカバーしています。

第二に、テンセントは先進的なクラウドコンピューティング技術能力を持っています。テンセントセキュリティフェデレーテッドラーニングアプリケーションサービス全体は、パブリッククラウドとプライベートクラウドの両方に基づいて展開できます。具体的な展開方法の面では、軽量で便利、拡張しやすく、管理しやすいコンテナ技術もサポートしています。

最後に、テンセントのインターネットの「内部の強み」があります。テンセントは連合学習アプリケーションサービスを構築する過程で、自社のインターネット製品とエンジニアリング能力をフルに活用し、ジョイントモデリングプロセスにおける通信と安定性のための特別な最適化を行いました。通信回数の最適化と中間結果の圧縮により、ジョイントモデリングプロセスで伝送する必要があるデータ量が削減され、効率が向上しました。また、ネットワーク環境による伝送中断に対しては、モデル専用のブレークポイントバックアップ機能が作成され、データ伝送が中断されても、最初からやり直すことなく、ブレークポイントから再開できます。

現在、実際のビジネス実践において、Tencent Security Federated Learning Application Service は、新しいジョイントモデルの AUC 値を 10%～15% 増加させ、最大 KS 値を約 50% 増加させました。江蘇銀行、済寧銀行、湖北消費者金融、九福数字科技、嘉銀金融科技などの金融機関と協力し、データ価値の双方向エンパワーメントを実現しました。

インターネットの巨人は、人工知能の次の段階をリードするのでしょうか?

人工知能の全体的な発展の傾向を見ると、2000年以降に大きな進歩を遂げた機械学習は、依然として人工知能の主な「進歩」であり、データも人工知能の実装プロセス全体で重要な役割を果たすでしょう。

人工知能の実装が進むにつれて、機械学習の「ハンマー」の発展は鈍化し始めています。さまざまな業界で多くの「小さな釘」を解決した後、必然的にさらに困難な「大きな釘」に直面することになります。短期間で「ハンマー」を大きくする方法はないので、複数の「ハンマー」が連携して動作する操作方法を使用して、複数人のコラボレーションを通じて人工知能の開発を維持または加速する必要があります。

しかし、フェデレーテッドラーニングは結局のところ単なる技術であり、一連の前提条件を満たす必要があります。申請者は、基本的な人工知能技術の研究能力、複数当事者のフェデレーテッドラーニングシステムのエンジニアリング能力、実際の運用への複数当事者の積極的な参加、および相当な初期投資と失敗のリスクを備えている必要があります。こうした前提条件は、一般の企業や組織にとっては不可能なものです。しかし、テンセントのようなインターネット大手にとっては、はるかに簡単です。

テンセントセキュリティの連合学習アプリケーションサービスと同様に、テンセントは顧客が連合学習を実装するためのチャネルを構築しただけでなく、自社の貴重な蓄積されたセキュリティのブラックとグレーの製品データベースを製品サービスに追加しました。このオープンで共有され協力的な精神と行動は、人工知能の将来の発展にとって重要な原動力になる可能性があります。

<<: 人工知能は10の新たな雇用を生み出す

>>: 究極のAlphaGo、DeepMindの新アルゴリズムMuZero、著者の解釈