アンドリュー・ン氏の新演説:AIは業界の状況を変えており、企業の障壁はアルゴリズムではなくデータである

アンドリュー・ン氏の新演説:AIは業界の状況を変えており、企業の障壁はアルゴリズムではなくデータである

[[204846]]

1. 人工知能の応用と価値

Andrew Ng 氏は、AI は新しい電気であると述べて例を挙げました。

AI 技術の経済的貢献のほとんどは、教師あり学習、つまり A から B、つまり入力から出力へのマッピングを学習することから生まれます。たとえば、写真を入力し、その写真があなた自身のものかどうかを機械が判断して 0 または 1 を出力するように学習させます。

AIの最も収益性の高い応用はオンライン広告です。この例では、入力は広告とユーザーの情報であり、出力はユーザーが広告をクリックするかどうか (これも 0 または 1) です。

教師あり学習は、ローン申請情報が入力され、ユーザーがローンを返済するかどうかが出力される消費者金融の分野にも応用できます。

過去数年間で機械学習は急速な発展を遂げ、この種の A から B へのマッピングを学習することにますます長けるようになり、大規模な経済的価値を生み出しています。同時に、教師あり学習の出力が0や1の数字に限定されなくなったことにもAIの進歩が反映されています。

別の例を見てみましょう。音声認識のタスクもエンドツーエンドの学習です。十分なデータがあれば、音声認識は非常に優れた結果を達成できます。 Amazon Alexa、Apple Siri、Baidu DuerOS などは、優れた結果を達成するために AI アルゴリズムとデータに依存しています。

教師あり学習の欠点は、大量のラベル付きデータが必要になることで、これが教師あり学習の人気に影響を与えています。

ニューラルネットワークは長年存在しているのに、なぜ AI は近年になってようやく急速に発展し始めたのでしょうか?

[[204847]]

上の図では、横軸がデータ量、縦軸がアルゴリズムのパフォーマンスです。

データ量が増えても、従来の機械学習アルゴリズムのパフォーマンスはそれほど向上していませんが、ニューラルネットワークのパフォーマンスは大幅に向上します。ニューラルネットワークが大きくなるほど、パフォーマンスの向上は明らかになります。

最高のパフォーマンスを実現するには、大量のデータと大規模なニューラル ネットワークが必要です。

2. 機械学習のトレンドとアルゴリズムが価値を生み出す仕組み

現在、教師あり学習は依然として最も価値を生み出しています。さらに、転移学習技術はさらなる経済的価値を生み出しています。例えば、医療画像診断では転移学習技術によりデータを活用して優れた認識効果を生み出します。

教師なし学習は自然言語処理においてより大きな商業的価値を持ちます。

強化学習も非常に興味深いです。強化学習の人気と商業化は、少し不釣り合いだと思います。

強化学習のデータに対する要求は、特に強化学習アルゴリズムが十分なデータを取得することが難しいため、教師あり学習よりもさらに深刻です。別の例: AI + ゲームでは、強化学習が非常にうまく機能します。これは、ビデオ ゲームでは、アルゴリズムがゲームを何度も繰り返しプレイして、最大限のデータを取得できるためです。

ロボット工学の分野では、強化学習を使用してシミュレータを構築することは、強化学習エージェントが無人車両やヒューマノイドロボットをシミュレートし、初めてゲームを繰り返すことを可能にすることと同じです。ゲームやロボット工学以外では、強化学習が商業的に応用されるまでにはまだまだ長い道のりがあります。

現在、教師あり学習、転移学習、教師なし学習、強化学習の 4 種類のアルゴリズムによって生み出される経済的価値は減少しています。

注目すべきもう 1 つの点は、機械学習は構造化データに依存し、非構造化データよりも多くの経済的なメカニズムを生み出すことです。

構造化データを例に挙げてみましょう。たとえば、データベースにはユーザーのトランザクション、誰が何をいつ購入したか、誰が誰にいつメッセージを送信したかが記録されます。これが構造化データです。画像、音声、自然言語などは非構造化データです。

上で述べたいくつかの種類の学習アルゴリズムの中で、教師あり学習だけが企業や起業家にとって多くの経済的価値と機会を生み出してきました。

3. 人工知能製品の作り方

AIの台頭により、企業の競争環境は変化しています。同社の障壁はもはやアルゴリズムではなく、データです。

図に示すように、AI 製品を構築したい:

[[204848]]

アルゴリズムが製品を実行するのに十分なデータを使用できるようにし、製品を通じてユーザーを獲得し、ユーザーがさらに多くのデータを提供する…というサイクルを繰り返します。

別の例: 検索会社。検索会社には、ユーザーが特定の用語を検索した場合にどのリンクをクリックする可能性が高いかを示す大量のデータがあります。

検索アルゴリズムの構築方法は知っていましたが、大手検索会社と同じデータセットがなければ、小規模なチームが同等に優れた検索エンジンを構築できるとは想像もつきませんでした。これらのデータ資産はバランスを保つための障壁を構築します。

エンジニアは、AI の影響が教師あり学習よりもはるかに広範囲に及ぶことも理解する必要があります。日常的な AI には、機械学習、グラフィカル モデル、計画アルゴリズム、ナレッジ グラフなど、さまざまな種類のツールが含まれています。

機械学習とディープラーニングに重点が置かれているのは、他のツールの開発ペースが遅いことが主な理由です。

コンピューター、つまりアルゴリズムは、何をすべきかをどのように判断するのでしょうか? それは、データと人間の介入という 2 つの情報源に依存しています。

たとえば、オンライン広告では、膨大なデータが存在するため、ディープラーニング アルゴリズムは、手作業をあまりかけずに非常にうまく学習できます。しかし、医療分野では、データの量が非常に少なく、おそらく数百サンプル程度であり、グラフィカルモデルを使用して人間の知識を導入するなど、多くの人手が必要になります。

多くのエンジニアが AI 分野に参入したいと考えており、その多くがオンライン コースを受講していますが、論文を読んでその中の研究を再現するという、見落とされがちな学習方法が 1 つあります。

十分な数の論文を読み、十分な数のアルゴリズムを練習すると、それらはすべてあなたの知識とアイデアに変換されます。

機械学習エンジニアになるには、deeplearning.ai などの機械学習コースを受講してしっかりとした基礎を築き、その後、論文を読んで結果を再現し、さらにさまざまな人工知能活動に参加して基礎を強化することをお勧めします。

4. AI企業を立ち上げる方法

約 25 年前より、私たちはインターネット時代の到来を目の当たりにしてきました。

あの時代から学んだこと:ショッピングモール+ウェブサイト≠インターネット企業

私は大手小売企業の CIO を知っています。かつて CEO が彼にこう言いました。「私たちはオンラインで商品を販売しています。Amazon もオンラインで商品を販売しています。私たちも同じです。」

これは間違っています。

インターネット企業はどのように定義されるのでしょうか? 重要なのは、Web サイトを持っているかどうかではなく、A/B テストを実施しているかどうか、迅速に反復できるかどうか、エンジニアと製品マネージャーによって意思決定が行われているかどうかです。これがインターネット企業の本質です。

AI時代においては、次のことも明確にする必要があります。

従来のテクノロジー企業 + 機械学習/ニューラルネットワーク ≠ AI企業

社内の数人がニューラル ネットワークを使用しているからといって、AI 企業になるわけではありません。より深い基盤が必要です。

AI企業は戦略的にデータを取得する傾向があります。

以前にも、ある地域で製品を発売し、別の地域で製品を発売するためにデータを取得し、さらに次の地域で製品を発売するためにデータを取得する、といったことを繰り返していました。そして、すべての製品を組み合わせることで、より大きな目標を達成するためのデータを取得するように設計されています。

GoogleやBaiduのような大手AI企業は非常に複雑な戦略を持ち、今後数年間に向けて万全の準備を整えています。

2 番目のポイントはより戦術的なものであり、今すぐ実行できます。AI 企業は通常、統合されたデータベースを持っています。

多くの企業には多数のデータベースがありますが、それらは分散しています。エンジニアがこれらのデータをまとめて何かを実行したい場合、50 人の異なる人とコミュニケーションを取る必要があるかもしれません。

したがって、すべてのデータが一緒に保存される統合データベースを構築するのは良い戦略だと思います。

さらに、自動化とカスタマイズされた採用ニーズも AI 企業の重要な特徴です。

たとえば、モバイル インターネットの時代では、製品マネージャーは PRD を次のように記述します。

[[204849]]

その後、エンジニアがそれを実装するので、プロセス全体が簡単に理解できます。

しかし、AI時代にチャットボットを作りたいとします。このとき、プロダクトマネージャーがワイヤーフレームを描いて「これはアバターです。これはチャットバブルです」と言っただけでは、問題は解決しません。

チャット バブルがどのように見えるかは重要ではありません。私が知る必要があるのは、チャットボットが何を言うかです。ワイヤーフレームはチャットボット プロジェクトには役に立ちません。

プロダクトマネージャーが自動運転車のワイヤーフレームを描いて「これを作ります」と言ったら、それはさらに無意味です。

AI 企業では、プロダクトマネージャーはエンジニアとコミュニケーションをとりながら、データに基づいて製品を反復してアップグレードする方法を学ぶ必要があります。

<<:  Adobe が超強力な人工知能ブラックテクノロジーをリリース、アーティストたちは職を失うかもしれない!

>>:  王の英雄を見極める – PM の機械学習初心者の旅

ブログ    
ブログ    

推薦する

...

AIロボットがCESを席巻! OpenAI は ChatGPT の軍事アプリケーションに対する制限を秘密裏に解除しました。Skynet は来るのでしょうか?

少し前にスタンフォード大学の「エビ揚げロボット」が数え切れないほどの人々をため息まじりにさせた。20...

農業における人工知能の応用

農業は人類の生存の基盤であり、第三次産業の中核的位置を占め、経済社会の安定と発展に極めて重要な産業で...

オントロジーから始める:オペレータ関係マップの構築と応用

[[258543]]人類学者ロビン・ダンバーは、人間が親密な人間関係を維持できる最大人数は 150 ...

今後 10 年間で人工知能が私たちの生活を支配するようになるとき、携帯電話はどのようなものになるでしょうか?

テクノロジー業界のほとんどの人は、今後 10 年以内にユビキタス テクノロジーが 1 日のあらゆる瞬...

建設業界における人工知能の応用

研究によると、建設業界では、計画や建設のいずれの用途でも、人工知能技術の応用がますます一般的になりつ...

「あなたのことを理解します」に向けて:ロボットは「他人の視点から考える」ことができる

「あなたはロボットですか?なぜ私の立場になって考えられないのですか?」人々が争いを抱えるたびに、この...

データマイニングの基本概念と最も一般的に使用されるアルゴリズムについての簡単な説明

現在、国民経済と生活のあらゆる分野でビッグデータの理論と応用が盛んに行われています。ビッグデータの基...

...

ゲイツ氏は人工知能に楽観的だが、グーグルが自動運転車に大きく賭けている理由が理解できない

ビル・ゲイツ氏は、世界中の職場にパーソナルコンピュータシステムとソフトウェアをもたらすことでキャリア...

クルーズの自動運転意思決定・計画技術の分析

クルーズ社の自動運転意思決定計画および制御部門の責任者であるブランドン・バッソ氏は、コロンビア大学で...

2000億回のオープン学習を経て、DeepMindのAIはさらに洗練されてきた

[[415688]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

ハーバード大学とMITがあるボストンは、政府が顔認識を禁止したと公式に発表した。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

機械翻訳から読心術まで、AIは人類のバベルの塔を再建できるのか?

聖書の旧約聖書創世記には、人類が団結して天国に通じるバベルの塔を建てたという話があります。この計画を...