落とし穴を避けよう!ニューラルネットワークの欠点と短所を数え上げよう

落とし穴を避けよう!ニューラルネットワークの欠点と短所を数え上げよう

最近、ディープラーニングが大々的に宣伝されており、人々はニューラル ネットワークをあらゆる場所で使用したいと熱望していますが、ニューラル ネットワークは本当にあらゆる場所で適用できるのでしょうか? これについては、次の章で説明します。これを読めば、ニューラル ネットワークの主な欠点がわかり、機械学習の問題に適したタイプのアルゴリズムを選択する際の大まかなガイドラインが得られます。また、現在私たちが直面している機械学習の主な問題についても学びます。

[[227138]]

目次:

  • なぜディープラーニングがこれほど注目されているのか?(データ、コンピューティング能力、アルゴリズム、マーケティング)
  • ニューラル ネットワークと従来のアルゴリズム (ブラック ボックス、開発期間、データ量、計算コストが高い)
  • まとめ
  • 結論は

ディープラーニングがなぜこれほど注目されているのでしょうか?

ディープラーニングが現在注目されている主な理由は、データ、コンピューティング能力、アルゴリズム自体、マーケティングの 4 つです。次のセクションでそれぞれについて説明します。

1. データ

ディープラーニングの人気が高まった要因の 1 つは、過去数年から数十年にわたって収集され、2018 年に利用可能になった膨大な量のデータです。これにより、ニューラル ネットワークはより多くのデータを取得するほど改善され、その潜在能力を真に発揮できるようになります。

対照的に、従来の機械学習アルゴリズムは、必然的に、データを増やしてもパフォーマンスが向上しないレベルに達します。次の図はこれを示しています。

2. 計算能力

もう 1 つの非常に重要な理由は、現在利用可能なコンピューティング能力によって、はるかに多くのデータを処理できるようになったことです。人工知能の第一人者であるレイ・カーツワイル氏によれば、コンピューティング能力は徐々に増加するのではなく、時間単位ごとに一定の係数で増加します(たとえば、毎年 2 倍になります)。これは、計算能力が指数関数的に増加していることを意味します。

3. アルゴリズム

ディープラーニングの人気が高まった3つ目の要因は、アルゴリズム自体の進歩です。アルゴリズム開発における最近の進歩は、主にアルゴリズムを以前よりも高速に実行できるようになり、より多くのデータを使用できるようになったことによるものです。

4. マーケティング

マーケティングも非常に重要な要素となるかもしれません。ニューラル ネットワークは数十年にわたって大きな注目を集めてきました (1944 年に初めて提案されました) が、当時は誰もそれを信じて投資したいとは思っていませんでした。 「ディープラーニング」というフレーズによって、ディープラーニングに新しい派手な名前が付けられ、新たな宣伝効果を生み出し、ディープラーニングが新しく作られた分野であると多くの人が誤解する原因となっています。

さらに、一般大衆の間で大きな論争を巻き起こしたハンソン・ロボティクス社の「ヒューマノイド」ロボット「ソフィア」や、マスメディアで取り上げられた機械学習の主要分野におけるいくつかのブレークスルーなど、他の要因もディープラーニングのマーケティングに貢献しています。

ニューラルネットワークと従来のアルゴリズム

ニューラル ネットワークと従来の機械学習アルゴリズムのどちらを使用すべきかは、解決しようとしている問題に大きく依存するため、答えるのが難しい質問です。これは「ノー・フリー・ランチ定理」によるもので、これは大まかに言えば、どんな問題でもうまく機能する「完璧な」機械学習アルゴリズムは存在しないというものです。あらゆる問題に対して、特定のアプローチが適しており、良い結果が得られる一方で、別のアプローチは失敗する可能性がありますが、これはおそらく機械学習の最も興味深い部分の 1 つです。

これは、複数のアルゴリズムに習熟する必要がある理由であり、優れた機械学習エンジニアやデータサイエンティストになるための最良の方法は実践である理由でもあります。この投稿では、どのタイプのアルゴリズムをいつ使用すればよいかをよりよく理解するのに役立つガイドラインをいくつか紹介します。

ニューラル ネットワークの主な利点は、ほぼすべての他の機械学習アルゴリズムの能力を上回っていることですが、これにはいくつかの欠点があり、この記事ではそれらについて説明して重点的に説明します。前に述べたように、ディープラーニングを使用するかどうかの決定は、主に解決しようとしている問題によって決まります。たとえば、がんの検出では、パフォーマンスが優れているほど、より多くの人が治療できるため、高いパフォーマンスが重要です。しかし、従来のアルゴリズムが満足できる以上の結果をもたらす機械学習の問題もあります。

1. ブラックボックス

  

おそらく、ニューラル ネットワークの最もよく知られている欠点は、その「ブラック ボックス」性です。つまり、ニューラル ネットワークが特定の出力を生成する方法と理由がまったくわからないということです。たとえば、猫の画像をニューラル ネットワークに入力して、それが車であると予測した場合、その予測が行われた原因を理解するのは困難です。人間が解釈できる特徴があれば、なぜ何かが間違っているのか理解するのがずっと簡単になります。それに比べて、決定木のようなアルゴリズムは非常に理解しやすいです。一部の分野では解釈可能性が非常に重要であるため、これは重要です。

多くの銀行が、ある人物が信用に値するかどうかを予測するためにニューラル ネットワークを使用しないのは、融資を受けられなかった理由を顧客に説明する必要があるためです。そうでなければ、その人はなぜ融資を受けられなかったのか理解できず、銀行から不当に脅迫されていると感じ、Quora のようなサイトのように、その銀行に対する意見が変わる可能性があります。機械学習アルゴリズムに基づいてユーザー アカウントを削除することにした場合、その理由をユーザーに説明する必要があります。コンピューターが出した答えに彼らが満足するとは思えない。

その他のシナリオは、機械学習によって推進される重要なビジネス上の意思決定です。大企業の CEO が、なぜそうすべきかを理解せずに、数百万ドルの決定を下すところを想像できますか? それは単に「コンピューター」がそうすべきだと言ったからです。

2. 開発期間

Keras のようなライブラリを使用するとニューラル ネットワークの開発が非常に簡単になりますが、機械学習で難しい問題を解決しようとしている場合など、アルゴリズムの詳細をより細かく制御する必要がある場合もあります。

次に、Tensorflow を選択すると、より多くの機会が得られますが、より複雑なため、開発に時間がかかります (構築したいものによって異なります)。すると、企業経営者にとっての疑問は、より単純なアルゴリズムではるかに速く解決できる問題の開発に、高額なエンジニアを何週間も費やすことが本当に価値があるのか​​どうかという点になります。

3. データ量

ニューラル ネットワークでは通常、従来の機械学習アルゴリズムよりもはるかに多くのデータ、少なくとも数千、あるいは数百万のラベル付きサンプルが必要になります。これは簡単に解決できる問題ではありませんが、他のアルゴリズムを使用すれば、多くの機械学習の問題はより少ないデータでうまく解決できます。

ニューラル ネットワークがごく少量のデータしか処理しないケースもありますが、ほとんどの場合はそうではありません。この場合、Naive Bayes のような単純なアルゴリズムは、少量のデータでうまく機能します。

  

4. 計算コストが高い

一般に、ニューラル ネットワークは従来のアルゴリズムよりも計算コストが高くなります。最先端のディープラーニング アルゴリズムでは、非常に深いニューラル ネットワークのトレーニングを成功させますが、ゼロから完全にトレーニングするには数週間かかる場合があります。従来の機械学習アルゴリズムのほとんどは、数分未満から数時間または数日かかります。

ニューラル ネットワークに必要な計算能力は、データのサイズに大きく依存しますが、ネットワークの深さと複雑さにも依存します。たとえば、1 つの層と 50 個のニューロンを持つニューラル ネットワークは、1000 本のツリーを持つランダム フォレストよりもはるかに高速になります。比較すると、50 層のニューラル ネットワークは、10 本のツリーのみのランダム フォレストよりもはるかに遅くなります。

まとめ

おそらく、ニューラル ネットワークは一部のタスクには最適ですが、他のタスクには必ずしも適していないことは、すでにご存知でしょう。大量のデータ、より高い計算能力、より優れたアルゴリズム、そしてスマートなマーケティングによって、ディープラーニングの人気が高まり、最もホットな分野の 1 つになったことを学びました。最も重要なことは、ニューラル ネットワークが、付随する欠点はあるものの、ほぼすべての他の機械学習アルゴリズムよりも優れていることを学んだことです。最大の欠点は、その「ブラック ボックス」の性質、開発時間の増加 (問題によって異なります)、必要なデータの量、そしてそのほとんどが計算コストが高いという事実です。

結論は

ディープラーニングはおそらくまだ少し過大評価されており、期待されていた成果を上回っています。しかし、だからといってそれが役に立たないということではありません。機械学習はますます民主化され、より多くの人が機械学習を使って便利な製品を構築できるようになっているため、私たちは機械学習のルネッサンス期を生きていると思います。機械学習によって解決できる問題はたくさんあり、今後数年のうちにそれが実現すると信じています。

主な問題の 1 つは、データ サイエンスで何ができるのかを理解し、企業に真の価値をもたらす優れたデータ サイエンス チームを構築する方法を知っている人が少数しかいないことです。一方では、機械学習の理論に関しては天才的だが、ビジネス面の理解が不足している博士レベルのエンジニアもいます。その一方で、ディープラーニングで何ができるのか全く分からず、数年以内にすべての問題が解決されると考えている CEO や管理職もいます。このギャップを埋めるにはより多くの人材が必要であり、それによって社会に役立つ製品がさらに生産されるようになるでしょう。

<<:  孫玄、Zhuanzhuan 社アーキテクチャアルゴリズム部門: AI によるマイクロサービスアーキテクチャ

>>:  人工知能ニューラルネットワークとは何ですか?なぜ人間の推論を実現したり、意識を生成したりできないのでしょうか?

推薦する

Go-OpenAI を使用して ChatGPT を簡単に呼び出し、無限の創造性を解き放ちましょう。

今日は、go-openai を使用して chatGPT を呼び出すという興味深いトピックを皆さんと共...

5G、自動運転、人工知能はどの段階にあるのでしょうか?一枚の写真でわかる

世界で最も権威のあるIT市場調査・コンサルティング会社であるガートナーは8月29日、新技術の2019...

2020年に人工知能を変える8つのトレンド

人工知能は長い間、架空の物語、SF、さらには映画にも登場してきました。人々の目には、これは技術的な魔...

彼女はマスクとビットコインへの多額の投資により伝説となった! 2021年のトップ10テクノロジートレンドを発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2020 年の AI と分析の 5 つの災害

今日の新しいテクノロジーの進歩により、私たちは皆、データの重要性を認識しています。データは新たな石油...

ディスカッション | 人工知能は同時通訳に取って代わることができるか?

[[254687]]少し前に同時通訳者がiFlytekを「AI同時通訳詐欺」と非難し、ネット上で騒...

顔認識を行うときになぜ服を着なければならないのですか?

人工知能の応用として、顔認識技術は私たちの生活のあらゆる側面に浸透しています。本人認証には顔認識が必...

...

Baidu UNITが小能科技を支援し、ハイアールグループと提携してインテリジェントクラウド顧客サービスをアップグレード

インテリジェントな顧客サービスの分野は、2018 年に急速な発展を遂げました。企業の人件費を抑制する...

AI基礎データサービス市場は新たな段階に入った

データプライバシー保護規制が継続的に改善され、国がデータ要素市場を積極的に育成し、データ流通が継続的...

...

アルゴリズム実践者が知っておくべき TensorFlow のヒント 10 選

導入これらを習得することで、モデルをより効率的にして開発効率を向上させることができます。 [[343...

50%-70%スリムダウン、Ctrip Taroミニプログラムサイズ削減計画

著者についてCtrip のフロントエンド開発者である Can は、現在ミニプログラムの開発に従事して...

AWSクラウド上で機械学習を輸出するための黄金のツールであるAmazon SageMakerが正式に中国に上陸

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...