機械学習は人工知能 (AI) の分野であり、データサイエンスはデータのクリーニング、準備、分析の分野です。人々は、それぞれのテクノロジーがどのように機能し、どのように連携するかを理解する必要があります。
機械学習 (ML) とデータ サイエンスはよく一緒に言及されますが、それには十分な理由があります。これら 2 つのテクノロジーは互いに補完し合いますが、それらがどのように機能し、どのように連携できるかを理解することが重要です。 機械学習は人工知能 (AI) の分野であり、コンピューターがデータから自ら学習し、人間の介入なしにその学習を適用できるようにします。 「本質的に、データサイエンスは実践分野であり、機械学習はツールと方法論のセットです」と、ビジネス変革およびアウトソーシングコンサルティング会社である Pace Harmon のプリンシパルである JP Baritugo 氏は述べています。「データサイエンスは、幅広い専門知識、ビジネス知識、ツール、および方法を使用してビッグデータを処理し、アクションを促進し、有意義なビジネス成果を達成する有意義な洞察を生み出します。」 機械学習にデータサイエンスが必要な理由 効果的な機械学習には優れたデータサイエンスが必要です。 「企業は、機械学習が正しく使用され、展開されるようにするために、データ サイエンティストの専門知識を必要としています」とバリトゥゴ氏は言います。データ サイエンティストは、モデルにトレーニング用のクリーンアップされ正規化されたデータセットが提供され、データセットと解決するビジネス上の問題に基づいて正しいアルゴリズムが使用されるようにすることができます。 「データサイエンスは、機械学習の領域を超えて応用できます」と、データサイエンス プラットフォーム RapidMiner の創設者兼社長である Ingo Mierswa 氏は語ります。「データサイエンスとは、人工知能、機械学習、ディープラーニング、およびビジネス環境におけるデータ準備の実用化です。データサイエンスの目標は、データから洞察を引き出し、将来の展開を予測し、アクションを提案すること (場合によってはそれらのアクションを自動化すること) であり、これは人工知能や機械学習などのツールによって実現されます。」 基本的に、データ サイエンティストは複数のソースからデータセットを収集して準備し、何らかの関数を適用してそこから洞察を抽出します。場合によっては、機械学習に手を染めることもあります。他の場合には、より根本的な分析が必要になる場合があります。 「少なくとも私の意見では、データサイエンスは単なるデータの操作です」とISGの自動化およびイノベーション担当ディレクター、ウェイン・バターフィールド氏は語る。 機械学習を使うべきタイミング 解決策が大量のデータの中に隠されている状況に直面した場合、機械学習は強力なツールになります。 「機械学習は、人間の作業員が行うのにかかる時間のほんの一部でデータを処理し、そこからパターンを抽出し、他の方法では得られない洞察を得るのに優れています」とミアスワ氏は語った。 たとえば、機械学習(データサイエンスに基づく)は、金融サービスにおけるリスク分析、不正検出、ポートフォリオ管理、GPS ベースの移動予測、Amazon や Netflix の製品やコンテンツの推奨に役立っています。 「機械学習は、すでに適切にラベル付けされた履歴データが大量にある場合や、データを非常に迅速にシミュレートできる場合の問題に最適です」とバターフィールド氏は言います。「トレーニングに十分なデータがない場合、機械学習を使用するには長い時間がかかります。」 「機械学習モデルの良し悪しは、学習元となるデータの質次第であり、世の中には大量のデータが存在するさまざまなタイプの問題が存在する」と、ミシガン工科大学コンピュータサイエンス学部のコンピュータシステム准教授で、コンピューティングおよびサイバーシステム研究所所長のティモシー・ヘイブンス氏は述べた。 「特定の問題は機械学習に適しています」とバターフィールド氏は説明します。「たとえば、データ サイエンス (機械学習は含みません) は長年予測や計画に応用されてきましたが、精度には限界がありました。天気、過去の病気のパターン、外部イベント、過去の需要など、複数のデータ ソースを考慮できる高度なアルゴリズムを構築できるようになったため、日単位だけでなく、おそらく 1 時間単位でも、はるかに正確な予測を得ることができます。」 金融サービスでは、機械学習とデータサイエンスが保険や詐欺防止のための強力なソリューションを提供できます。 IT アプリケーションでは、ネットワーク管理を改善できます。医療機関は、機械学習とデータ サイエンスを適用して、診断の精度を向上させ、最適な価格と量の組み合わせを決定したり、患者の転帰を予測したりすることができます。顧客体験管理では、顧客とのやり取りを改善し、顧客生涯価値を予測し、顧客離れを見積もるために協力します。小売業者はそれらを使用して需要を予測できます。価格設定を最適化し、顧客をセグメント化します。製造業では、データ サイエンスと機械学習を使用して、サプライ チェーンを自動化し、計画を改善できます。 データサイエンスだけで十分なとき AI を取り巻く技術的アプリケーションにより、あらゆるビジネス上の問題が機械学習を導入するチャンスのように見え始めています。しかし、多くの場合、機械学習は適切に機能しないか、より大きな損害を引き起こす可能性があります。 エベレスト グループの副社長であるアニル ビジャヤン氏は、「データ サイエンスだけで十分な場合もあります。境界があいまいなため、データ サイエンスと機械学習を明確に区別することは困難です。結局のところ、ほとんどのアルゴリズムは統計的手法を使用しています。すべての問題を解決するために人工知能が必要なわけではありません。多くの場合、従来のデータ サイエンスを使用すれば十分であるだけでなく、より効率的である可能性もあります」と述べています。 ビジャヤン氏は、出力が比較的少数のパラメータに依存し、それらのパラメータが時間の経過とともにあまり変化しない状況では、従来のデータサイエンス手法(機械学習を使用しない)の方が効果的かもしれないと述べた。さらに、出力とパラメータの関係が十分に理解されており、変化する可能性が低い場合は、データ サイエンスのみを採用するだけで十分です。 |
<<: インテル、IoTとエッジ向け第10世代プロセッサーを発表
>>: ワンクリックで顔のピクセル画像を生成し、Animal Crossingにアップロードしましょう!このプロジェクトは楽しい
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
選択ソートの基本的な操作は、ソートするデータ要素から毎回最小(または最大)の要素を選択し、ソートする...
ここ数年、国内の写真アプリが次々と登場しており、先頭にはDuitang、Huaban、Digu、Yo...
人工知能とデータサイエンスは、2023 年に最もエキサイティングで影響力のある 2 つのテクノロジー...
統計モデルやその他のアルゴリズムに加えて、回帰は機械学習を正常に動作させるための重要な要素です。回帰...
参考: 20 世紀のベスト: 編集者が選ぶトップ 10 アルゴリズム。著者:バリー・A・シプラ。アド...
IT Homeは11月30日、GoogleのDeepMindが人工知能(AI)を使って200万以上の...
翻訳者 | ジン・ヤンレビュー | Chonglou生成 AI は、急速に進化するテクノロジー分野に...
人工知能の基礎教育を強化することは、将来の社会の発展に備えるための避けられない選択であり、要件です。...
そうです、グラフィックカードを作っている会社、NVIDIA です。 NV はグラフィック カード メ...