アンドリュー・ン氏の新演説：AIは業界の状況を変えており、企業の障壁はアルゴリズムではなくデータである

[[204846]]

1. 人工知能の応用と価値

Andrew Ng 氏は、AI は新しい電気であると述べて例を挙げました。

AI 技術の経済的貢献のほとんどは、教師あり学習、つまり A から B、つまり入力から出力へのマッピングを学習することから生まれます。たとえば、写真を入力し、その写真があなた自身のものかどうかを機械が判断して 0 または 1 を出力するように学習させます。

AIの最も収益性の高い応用はオンライン広告です。この例では、入力は広告とユーザーの情報であり、出力はユーザーが広告をクリックするかどうか (これも 0 または 1) です。

教師あり学習は、ローン申請情報が入力され、ユーザーがローンを返済するかどうかが出力される消費者金融の分野にも応用できます。

過去数年間で機械学習は急速な発展を遂げ、この種の A から B へのマッピングを学習することにますます長けるようになり、大規模な経済的価値を生み出しています。同時に、教師あり学習の出力が0や1の数字に限定されなくなったことにもAIの進歩が反映されています。

別の例を見てみましょう。音声認識のタスクもエンドツーエンドの学習です。十分なデータがあれば、音声認識は非常に優れた結果を達成できます。 Amazon Alexa、Apple Siri、Baidu DuerOS などは、優れた結果を達成するために AI アルゴリズムとデータに依存しています。

教師あり学習の欠点は、大量のラベル付きデータが必要になることで、これが教師あり学習の人気に影響を与えています。

ニューラルネットワークは長年存在しているのに、なぜ AI は近年になってようやく急速に発展し始めたのでしょうか?

[[204847]]

上の図では、横軸がデータ量、縦軸がアルゴリズムのパフォーマンスです。

データ量が増えても、従来の機械学習アルゴリズムのパフォーマンスはそれほど向上していませんが、ニューラルネットワークのパフォーマンスは大幅に向上します。ニューラルネットワークが大きくなるほど、パフォーマンスの向上は明らかになります。

最高のパフォーマンスを実現するには、大量のデータと大規模なニューラルネットワークが必要です。

2. 機械学習のトレンドとアルゴリズムが価値を生み出す仕組み

現在、教師あり学習は依然として最も価値を生み出しています。さらに、転移学習技術はさらなる経済的価値を生み出しています。例えば、医療画像診断では転移学習技術によりデータを活用して優れた認識効果を生み出します。

教師なし学習は自然言語処理においてより大きな商業的価値を持ちます。

強化学習も非常に興味深いです。強化学習の人気と商業化は、少し不釣り合いだと思います。

強化学習のデータに対する要求は、特に強化学習アルゴリズムが十分なデータを取得することが難しいため、教師あり学習よりもさらに深刻です。別の例: AI + ゲームでは、強化学習が非常にうまく機能します。これは、ビデオゲームでは、アルゴリズムがゲームを何度も繰り返しプレイして、最大限のデータを取得できるためです。

ロボット工学の分野では、強化学習を使用してシミュレータを構築することは、強化学習エージェントが無人車両やヒューマノイドロボットをシミュレートし、初めてゲームを繰り返すことを可能にすることと同じです。ゲームやロボット工学以外では、強化学習が商業的に応用されるまでにはまだまだ長い道のりがあります。

現在、教師あり学習、転移学習、教師なし学習、強化学習の 4 種類のアルゴリズムによって生み出される経済的価値は減少しています。

注目すべきもう 1 つの点は、機械学習は構造化データに依存し、非構造化データよりも多くの経済的なメカニズムを生み出すことです。

構造化データを例に挙げてみましょう。たとえば、データベースにはユーザーのトランザクション、誰が何をいつ購入したか、誰が誰にいつメッセージを送信したかが記録されます。これが構造化データです。画像、音声、自然言語などは非構造化データです。

上で述べたいくつかの種類の学習アルゴリズムの中で、教師あり学習だけが企業や起業家にとって多くの経済的価値と機会を生み出してきました。

3. 人工知能製品の作り方

AIの台頭により、企業の競争環境は変化しています。同社の障壁はもはやアルゴリズムではなく、データです。

図に示すように、AI 製品を構築したい:

[[204848]]

アルゴリズムが製品を実行するのに十分なデータを使用できるようにし、製品を通じてユーザーを獲得し、ユーザーがさらに多くのデータを提供する…というサイクルを繰り返します。

別の例: 検索会社。検索会社には、ユーザーが特定の用語を検索した場合にどのリンクをクリックする可能性が高いかを示す大量のデータがあります。

検索アルゴリズムの構築方法は知っていましたが、大手検索会社と同じデータセットがなければ、小規模なチームが同等に優れた検索エンジンを構築できるとは想像もつきませんでした。これらのデータ資産はバランスを保つための障壁を構築します。

エンジニアは、AI の影響が教師あり学習よりもはるかに広範囲に及ぶことも理解する必要があります。日常的な AI には、機械学習、グラフィカルモデル、計画アルゴリズム、ナレッジグラフなど、さまざまな種類のツールが含まれています。

機械学習とディープラーニングに重点が置かれているのは、他のツールの開発ペースが遅いことが主な理由です。

コンピューター、つまりアルゴリズムは、何をすべきかをどのように判断するのでしょうか? それは、データと人間の介入という 2 つの情報源に依存しています。

たとえば、オンライン広告では、膨大なデータが存在するため、ディープラーニングアルゴリズムは、手作業をあまりかけずに非常にうまく学習できます。しかし、医療分野では、データの量が非常に少なく、おそらく数百サンプル程度であり、グラフィカルモデルを使用して人間の知識を導入するなど、多くの人手が必要になります。

多くのエンジニアが AI 分野に参入したいと考えており、その多くがオンラインコースを受講していますが、論文を読んでその中の研究を再現するという、見落とされがちな学習方法が 1 つあります。

十分な数の論文を読み、十分な数のアルゴリズムを練習すると、それらはすべてあなたの知識とアイデアに変換されます。

機械学習エンジニアになるには、deeplearning.ai などの機械学習コースを受講してしっかりとした基礎を築き、その後、論文を読んで結果を再現し、さらにさまざまな人工知能活動に参加して基礎を強化することをお勧めします。

4. AI企業を立ち上げる方法

約 25 年前より、私たちはインターネット時代の到来を目の当たりにしてきました。

あの時代から学んだこと：ショッピングモール＋ウェブサイト≠インターネット企業

私は大手小売企業の CIO を知っています。かつて CEO が彼にこう言いました。「私たちはオンラインで商品を販売しています。Amazon もオンラインで商品を販売しています。私たちも同じです。」

これは間違っています。

インターネット企業はどのように定義されるのでしょうか? 重要なのは、Web サイトを持っているかどうかではなく、A/B テストを実施しているかどうか、迅速に反復できるかどうか、エンジニアと製品マネージャーによって意思決定が行われているかどうかです。これがインターネット企業の本質です。

AI時代においては、次のことも明確にする必要があります。

従来のテクノロジー企業 + 機械学習/ニューラルネットワーク ≠ AI企業

社内の数人がニューラルネットワークを使用しているからといって、AI 企業になるわけではありません。より深い基盤が必要です。

AI企業は戦略的にデータを取得する傾向があります。

以前にも、ある地域で製品を発売し、別の地域で製品を発売するためにデータを取得し、さらに次の地域で製品を発売するためにデータを取得する、といったことを繰り返していました。そして、すべての製品を組み合わせることで、より大きな目標を達成するためのデータを取得するように設計されています。

GoogleやBaiduのような大手AI企業は非常に複雑な戦略を持ち、今後数年間に向けて万全の準備を整えています。

2 番目のポイントはより戦術的なものであり、今すぐ実行できます。AI 企業は通常、統合されたデータベースを持っています。

多くの企業には多数のデータベースがありますが、それらは分散しています。エンジニアがこれらのデータをまとめて何かを実行したい場合、50 人の異なる人とコミュニケーションを取る必要があるかもしれません。

したがって、すべてのデータが一緒に保存される統合データベースを構築するのは良い戦略だと思います。

さらに、自動化とカスタマイズされた採用ニーズも AI 企業の重要な特徴です。

たとえば、モバイルインターネットの時代では、製品マネージャーは PRD を次のように記述します。

[[204849]]

その後、エンジニアがそれを実装するので、プロセス全体が簡単に理解できます。

しかし、AI時代にチャットボットを作りたいとします。このとき、プロダクトマネージャーがワイヤーフレームを描いて「これはアバターです。これはチャットバブルです」と言っただけでは、問題は解決しません。

チャットバブルがどのように見えるかは重要ではありません。私が知る必要があるのは、チャットボットが何を言うかです。ワイヤーフレームはチャットボットプロジェクトには役に立ちません。

プロダクトマネージャーが自動運転車のワイヤーフレームを描いて「これを作ります」と言ったら、それはさらに無意味です。

AI 企業では、プロダクトマネージャーはエンジニアとコミュニケーションをとりながら、データに基づいて製品を反復してアップグレードする方法を学ぶ必要があります。

<<: Adobe が超強力な人工知能ブラックテクノロジーをリリース、アーティストたちは職を失うかもしれない!

>>: 王の英雄を見極める – PM の機械学習初心者の旅

テスラの秘密チームが暴露：ネガティブなニュースを抑え、虚偽入札の段階を乗り切ることに特化

ブログ

アンドリュー・ン氏の新演説：AIは業界の状況を変えており、企業の障壁はアルゴリズムではなくデータである

テスラの秘密チームが暴露：ネガティブなニュースを抑え、虚偽入札の段階を乗り切ることに特化

クラウドインテリジェンス統合戦略は「生態学的繁栄」を追加し、Baidu Smart Cloudは大規模モデル向けのフルリンク生態学的サポートシステムを確立します

GPT-4: 私が書いたコードを使ってみますか?調査によると、APIの不正使用率は62%を超えている。

調査によると、ヨーロッパ人はロボットに対してますます懐疑的になっている

人工知能とモノのインターネット - 未来の技術の融合

プログラマーはアルゴリズム思考をどのように向上させることができるでしょうか?

人間とコンピュータのインタラクションにおける状況認識

推薦する

IBMは顔認識技術の開発を中止し、議会に書簡を送った。

人工知能を使って手作業を置き換え、コストを削減し、効率を高めることは、まさに賢いことだ

人工知能に対する期待と不安

顔スキャンは便利ですが、隠れた危険も伴うので、注意が必要です。

MIT は、思考を通じて機械にタスクを実行させるブラックテクノロジーを開発

9つの一般的な畳み込みニューラルネットワークの紹介

歯科サービスを変える人工知能の6つのトレンド

物理学者が67年前に予測した「悪魔」がネイチャー誌に登場:「偽の」高温超伝導体で偶然発見

ナレッジグラフはどのようにして「人工知能」をよりスマートにするのでしょうか?

TCPとUDPの違いと、フロー制御、輻輳制御、高速再送、高速回復アルゴリズムの詳細な説明

スマート製造とAIが環境にどのように役立つか

すべてのビジネスデータを使用しても、AI に完全に入力することはできませんか?この小さなサンプル学習キットをお試しください

進化する決定木: 機械学習が生物学からヒントを得るとき