落とし穴を避けよう！ニューラルネットワークの欠点と短所を数え上げよう

最近、ディープラーニングが大々的に宣伝されており、人々はニューラルネットワークをあらゆる場所で使用したいと熱望していますが、ニューラルネットワークは本当にあらゆる場所で適用できるのでしょうか? これについては、次の章で説明します。これを読めば、ニューラルネットワークの主な欠点がわかり、機械学習の問題に適したタイプのアルゴリズムを選択する際の大まかなガイドラインが得られます。また、現在私たちが直面している機械学習の主な問題についても学びます。

[[227138]]

目次：

なぜディープラーニングがこれほど注目されているのか？（データ、コンピューティング能力、アルゴリズム、マーケティング）
ニューラルネットワークと従来のアルゴリズム (ブラックボックス、開発期間、データ量、計算コストが高い)
まとめ
結論は

ディープラーニングがなぜこれほど注目されているのでしょうか?

ディープラーニングが現在注目されている主な理由は、データ、コンピューティング能力、アルゴリズム自体、マーケティングの 4 つです。次のセクションでそれぞれについて説明します。

1. データ

ディープラーニングの人気が高まった要因の 1 つは、過去数年から数十年にわたって収集され、2018 年に利用可能になった膨大な量のデータです。これにより、ニューラルネットワークはより多くのデータを取得するほど改善され、その潜在能力を真に発揮できるようになります。

対照的に、従来の機械学習アルゴリズムは、必然的に、データを増やしてもパフォーマンスが向上しないレベルに達します。次の図はこれを示しています。

2. 計算能力

もう 1 つの非常に重要な理由は、現在利用可能なコンピューティング能力によって、はるかに多くのデータを処理できるようになったことです。人工知能の第一人者であるレイ・カーツワイル氏によれば、コンピューティング能力は徐々に増加するのではなく、時間単位ごとに一定の係数で増加します（たとえば、毎年 2 倍になります）。これは、計算能力が指数関数的に増加していることを意味します。

3. アルゴリズム

ディープラーニングの人気が高まった3つ目の要因は、アルゴリズム自体の進歩です。アルゴリズム開発における最近の進歩は、主にアルゴリズムを以前よりも高速に実行できるようになり、より多くのデータを使用できるようになったことによるものです。

4. マーケティング

マーケティングも非常に重要な要素となるかもしれません。ニューラルネットワークは数十年にわたって大きな注目を集めてきました (1944 年に初めて提案されました) が、当時は誰もそれを信じて投資したいとは思っていませんでした。「ディープラーニング」というフレーズによって、ディープラーニングに新しい派手な名前が付けられ、新たな宣伝効果を生み出し、ディープラーニングが新しく作られた分野であると多くの人が誤解する原因となっています。

さらに、一般大衆の間で大きな論争を巻き起こしたハンソン・ロボティクス社の「ヒューマノイド」ロボット「ソフィア」や、マスメディアで取り上げられた機械学習の主要分野におけるいくつかのブレークスルーなど、他の要因もディープラーニングのマーケティングに貢献しています。

ニューラルネットワークと従来のアルゴリズム

ニューラルネットワークと従来の機械学習アルゴリズムのどちらを使用すべきかは、解決しようとしている問題に大きく依存するため、答えるのが難しい質問です。これは「ノー・フリー・ランチ定理」によるもので、これは大まかに言えば、どんな問題でもうまく機能する「完璧な」機械学習アルゴリズムは存在しないというものです。あらゆる問題に対して、特定のアプローチが適しており、良い結果が得られる一方で、別のアプローチは失敗する可能性がありますが、これはおそらく機械学習の最も興味深い部分の 1 つです。

これは、複数のアルゴリズムに習熟する必要がある理由であり、優れた機械学習エンジニアやデータサイエンティストになるための最良の方法は実践である理由でもあります。この投稿では、どのタイプのアルゴリズムをいつ使用すればよいかをよりよく理解するのに役立つガイドラインをいくつか紹介します。

ニューラルネットワークの主な利点は、ほぼすべての他の機械学習アルゴリズムの能力を上回っていることですが、これにはいくつかの欠点があり、この記事ではそれらについて説明して重点的に説明します。前に述べたように、ディープラーニングを使用するかどうかの決定は、主に解決しようとしている問題によって決まります。たとえば、がんの検出では、パフォーマンスが優れているほど、より多くの人が治療できるため、高いパフォーマンスが重要です。しかし、従来のアルゴリズムが満足できる以上の結果をもたらす機械学習の問題もあります。

1. ブラックボックス

おそらく、ニューラルネットワークの最もよく知られている欠点は、その「ブラックボックス」性です。つまり、ニューラルネットワークが特定の出力を生成する方法と理由がまったくわからないということです。たとえば、猫の画像をニューラルネットワークに入力して、それが車であると予測した場合、その予測が行われた原因を理解するのは困難です。人間が解釈できる特徴があれば、なぜ何かが間違っているのか理解するのがずっと簡単になります。それに比べて、決定木のようなアルゴリズムは非常に理解しやすいです。一部の分野では解釈可能性が非常に重要であるため、これは重要です。

多くの銀行が、ある人物が信用に値するかどうかを予測するためにニューラルネットワークを使用しないのは、融資を受けられなかった理由を顧客に説明する必要があるためです。そうでなければ、その人はなぜ融資を受けられなかったのか理解できず、銀行から不当に脅迫されていると感じ、Quora のようなサイトのように、その銀行に対する意見が変わる可能性があります。機械学習アルゴリズムに基づいてユーザーアカウントを削除することにした場合、その理由をユーザーに説明する必要があります。コンピューターが出した答えに彼らが満足するとは思えない。

その他のシナリオは、機械学習によって推進される重要なビジネス上の意思決定です。大企業の CEO が、なぜそうすべきかを理解せずに、数百万ドルの決定を下すところを想像できますか? それは単に「コンピューター」がそうすべきだと言ったからです。

2. 開発期間

Keras のようなライブラリを使用するとニューラルネットワークの開発が非常に簡単になりますが、機械学習で難しい問題を解決しようとしている場合など、アルゴリズムの詳細をより細かく制御する必要がある場合もあります。

次に、Tensorflow を選択すると、より多くの機会が得られますが、より複雑なため、開発に時間がかかります (構築したいものによって異なります)。すると、企業経営者にとっての疑問は、より単純なアルゴリズムではるかに速く解決できる問題の開発に、高額なエンジニアを何週間も費やすことが本当に価値があるのかどうかという点になります。

3. データ量

ニューラルネットワークでは通常、従来の機械学習アルゴリズムよりもはるかに多くのデータ、少なくとも数千、あるいは数百万のラベル付きサンプルが必要になります。これは簡単に解決できる問題ではありませんが、他のアルゴリズムを使用すれば、多くの機械学習の問題はより少ないデータでうまく解決できます。

ニューラルネットワークがごく少量のデータしか処理しないケースもありますが、ほとんどの場合はそうではありません。この場合、Naive Bayes のような単純なアルゴリズムは、少量のデータでうまく機能します。

4. 計算コストが高い

一般に、ニューラルネットワークは従来のアルゴリズムよりも計算コストが高くなります。最先端のディープラーニングアルゴリズムでは、非常に深いニューラルネットワークのトレーニングを成功させますが、ゼロから完全にトレーニングするには数週間かかる場合があります。従来の機械学習アルゴリズムのほとんどは、数分未満から数時間または数日かかります。

ニューラルネットワークに必要な計算能力は、データのサイズに大きく依存しますが、ネットワークの深さと複雑さにも依存します。たとえば、1 つの層と 50 個のニューロンを持つニューラルネットワークは、1000 本のツリーを持つランダムフォレストよりもはるかに高速になります。比較すると、50 層のニューラルネットワークは、10 本のツリーのみのランダムフォレストよりもはるかに遅くなります。

まとめ

おそらく、ニューラルネットワークは一部のタスクには最適ですが、他のタスクには必ずしも適していないことは、すでにご存知でしょう。大量のデータ、より高い計算能力、より優れたアルゴリズム、そしてスマートなマーケティングによって、ディープラーニングの人気が高まり、最もホットな分野の 1 つになったことを学びました。最も重要なことは、ニューラルネットワークが、付随する欠点はあるものの、ほぼすべての他の機械学習アルゴリズムよりも優れていることを学んだことです。最大の欠点は、その「ブラックボックス」の性質、開発時間の増加 (問題によって異なります)、必要なデータの量、そしてそのほとんどが計算コストが高いという事実です。

結論は

ディープラーニングはおそらくまだ少し過大評価されており、期待されていた成果を上回っています。しかし、だからといってそれが役に立たないということではありません。機械学習はますます民主化され、より多くの人が機械学習を使って便利な製品を構築できるようになっているため、私たちは機械学習のルネッサンス期を生きていると思います。機械学習によって解決できる問題はたくさんあり、今後数年のうちにそれが実現すると信じています。

主な問題の 1 つは、データサイエンスで何ができるのかを理解し、企業に真の価値をもたらす優れたデータサイエンスチームを構築する方法を知っている人が少数しかいないことです。一方では、機械学習の理論に関しては天才的だが、ビジネス面の理解が不足している博士レベルのエンジニアもいます。その一方で、ディープラーニングで何ができるのか全く分からず、数年以内にすべての問題が解決されると考えている CEO や管理職もいます。このギャップを埋めるにはより多くの人材が必要であり、それによって社会に役立つ製品がさらに生産されるようになるでしょう。

<<: 孫玄、Zhuanzhuan 社アーキテクチャアルゴリズム部門: AI によるマイクロサービスアーキテクチャ

>>: 人工知能ニューラルネットワークとは何ですか?なぜ人間の推論を実現したり、意識を生成したりできないのでしょうか?