機械学習とは何ですか?機械はどんどん賢くなっていて、もはやSFの世界ではない

機械学習とは何ですか?機械はどんどん賢くなっていて、もはやSFの世界ではない

[[351468]]

機械学習 (ML) は、一連のデータに基づいて予測を行うようにコンピューター システムを学習させるプロセスです。機械学習の研究者は、一連の試行錯誤のシナリオをシステムに入力することで、データを分析し、質問に答え、自ら意思決定を行うことができる AI システムの作成に取り組んでいます。

機械学習では通常、将来の意思決定における推論とパターン認識に役立つテスト データに基づくアルゴリズムが使用されるため、従来のコンピューター ソフトウェアで必要となる人間からの明示的な指示が不要になります。

機械学習とは何ですか?

機械学習は、アルゴリズムに入力される大量のデータに依存し、システムが将来の決定を予測できるモデルを生成します。たとえば、システムに入力するデータが 1 年間毎日昼食に食べる果物である場合、予測アルゴリズムを使用してさまざまな果物を分析し、翌年に食べる可能性のある果物の予測モデルを構築できます。

このプロセスは試行錯誤に基づいており、多くの場合、さまざまなアルゴリズムが使用されます。これらのアルゴリズムは、線形モデル、非線形モデル、さらにはニューラル ネットワークに分類されます。最終的には、作業しているデータセットと回答しようとしている質問によって異なります。

機械学習アルゴリズムはどのように機能するのでしょうか?

機械学習アルゴリズムは、データを使用して時間の経過とともに学習および改善するため、人間の指導は必要ありません。アルゴリズムは、教師あり学習、教師なし学習、強化学習の 3 つのタイプに分類されます。学習の種類ごとに目的が異なり、データの使用方法も異なります。

教師あり学習

教師あり学習には、アルゴリズムが入力変数を出力変数に変換して方程式を解くマッピング関数を学習するために使用するラベル付けされたトレーニング データが含まれます。教師あり学習には 2 つのタイプがあります。出力がカテゴリ形式の場合の分類は、特定のサンプルの結果を予測するために使用されます。出力がカテゴリ形式の場合の回帰は、特定のサンプルの結果を予測するために使用されます。変数は「給与」や「体重」などの実際の値です。

教師あり学習モデルの例としては、パターン認識手法である K 近傍法 (KNN) アルゴリズムがあります。 KNN は基本的に、グラフを使用して、近くにある類似のオブジェクトの分布に基づいてオブジェクトの分類について推測を行います。

上記の表では、緑色の円は、青い四角形または赤い三角形の 2 つのカテゴリのいずれかにのみ属することができる未分類のオブジェクトを表します。この場合、どのカテゴリに属する​​かを識別するために、アルゴリズムはグラフ上の最も近いオブジェクトを分析し、緑色の円は赤い三角形のカテゴリに属する​​と合理的に想定します。

教師なし学習

教師なし学習モデルは、入力変数のみがあり、対応する出力変数がない場合に使用されます。ラベルのないトレーニング データを使用して、データの基礎となる構造をモデル化します。

教師なし学習アルゴリズムには、市場ショッピング分析で広く使用されている関連付け、別のクラスター内のオブジェクトに類似するサンプルを一致させるために使用されるクラスタリング、および重要な情報をそのまま維持しながらデータセット内の変数の数を減らすために使用される次元削減の 3 つのタイプがあります。

強化学習

強化学習により、エージェントは報酬を最大化する行動を学習し、現在の状態に基づいて次のアクションを決定できるようになります。これはゲームのコンテキストでよく使用され、アルゴリズムがルールを提供し、最も効率的な方法で課題を解決する役割を果たします。モデルは最初はランダムに開始しますが、時間の経過とともに試行錯誤し、スコアを最大化するためにゲーム内でどこにいつ移動する必要があるかを学習します。

このタイプのトレーニングでは、報酬は単に肯定的な結果に関連付けられたステータスです。たとえば、アルゴリズムが障害物にぶつかることなく車を道路上に維持することができれば、ミッション達成として「報酬」が与えられます。

[[351469]]

機械学習はなぜ役立つのでしょうか?

本質的に、機械学習はデータが多すぎるという問題を解決します。人、行動、出来事、コンピューター、ガジェットによって生成される情報は膨大で、人間がそこから何かを学ぶことはほぼ不可能です。医療分析では、何千もの MRI スキャンからパターンを見つけるのに人間が数時間、数日、または数週間かかる場合がありますが、機械は、正しくラベル付けされていれば、その情報を吸収して数秒でそれらのパターンを見つけることができます。

機械学習はどこで使用されていますか?

機械学習の最もシンプルで成功した例の 1 つは、私たちが毎日使用しているもの、つまり Google 検索です。検索エンジンは、入力したテキストを読み取って分析し、検索履歴やオンライン習慣に基づいて結果をカスタマイズする多数の ML アルゴリズムを搭載しています。たとえば、「Java」と入力すると、好みに応じて、プログラミング言語を中心とした結果が表示されたり、より頻繁に表示されたりします。

自動運転車やスマートシティなど、将来の技術の進歩の多くは機械学習の進歩に依存しています。スマートシティを支えるシステムの多くは、顔認識システムなど公共の場にも導入されつつあります。顔認識システムでは、機械学習アルゴリズムが画像内のパターンを認識し、その特徴に基づいて物体を識別するように学習されます。しかし、これは必ずしも正確ではないことや、国民に対する何らかの定期的な監視を伴うことが多いことから、ML の物議を醸す使用法であることが判明しています。

データの偏り

機械学習が進歩し、より多くの技術が使用されるようになるにつれて、重要な一般向けソフトウェアに偏見が組み込まれることへの懸念が高まっています。機械学習アプリケーションはデータに依存しており、このデータがバイアスの原因となる可能性があります。たとえば、企業がより多様な人材を採用したいのに、現在の従業員の履歴書を使用する場合、その機械学習プログラムは、デフォルトで同じ人材をさらに探すことになります。

政府の間で懸念を引き起こしているのは、このタイプの機械学習アプリケーションであり、その結果、多くの政府がこの問題に対処するために強制的な規制を導入しています。英国データ倫理・イノベーションセンター(CDEI)は、アルゴリズムによる意思決定における潜在的な偏見を調査するため、内閣府の人種格差ユニットと協力すると発表した。同様に、米国政府は、コンピューター システムにおける性別や人種による偏見のリスクを軽減するために、AI における多様性規制を試験的に導入する予定です。

<<:  ブロックチェーンのいくつかのコンセンサスアルゴリズム

>>:  機械学習と古典的なアルゴリズムの概念をわかりやすい言葉で説明しました。初心者必読

ブログ    
ブログ    

推薦する

加速を解き放つ、8月の自動運転業界の動向の概要

[[419694]]チップ不足と疫病の影響により、今年初めから自動運転産業の発展は減速を余儀なくされ...

OSPFはSPFアルゴリズムを使用してルートを伝播します

SPF アルゴリズムは、各ルータをルートとして使用して、各宛先ルータまでの距離を計算します。各ルータ...

Python を使用して画像からテーブルを抽出する

約 1 年前、私はファイルからデータ、主にテーブルに含まれるデータを抽出して構造化するタスクを割り当...

テンセント、初のAI+医療製品「テンセントミイン」の発売を発表

テンセントは本日、初のAI医療支援診断・治療オープンプラットフォーム(以下、AI支援診断オープンプラ...

大型模型のレイアウトは何度も変わります!

ChatGPT の Android バージョンが登場します。 OpenAI は今年 5 月に早くも...

【ディープラーニング連載】畳み込みニューラルネットワーク(CNN)の原理を徹底解説(I) - 基本原理

前回の記事では、PaddlePaddle を使用して手書きの数字を認識する例を示し、ネットワーク構造...

青春が戻ってきた! AIが『スラムダンク』の登場人物を実在の人物に変身させたら、一番イケメンは流川楓じゃないのか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

AIに単純なことを教える: ゼロから最初のニューラルネットワークを構築する

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

ロボットはどうやってコーヒーを飲みながら心臓手術を行うのでしょうか?

「2、3年前、アメリカの医師たちが手術室の外に座り、コーヒーを片手にしているのを見ました。彼らはリ...

ブロックチェーンは人工知能をどのように変えるのでしょうか?

人工知能とブロックチェーンは、現在人気が高まっている2つの人気産業です。 2つの技術は異なり、商業的...

機械学習アルゴリズムの新たな女王 — XGBoost

15年前の初出勤の日のことを今でも覚えています。大学院を終えて、世界的な投資銀行にアナリストとして...

すべてを圧縮するだけです! OpenAIの主任科学者イリヤ・スツケバーが教師なし学習に注目

最近、OpenAI の主任科学者 Ilya Sutskever 氏が、計算理論の研究に重点を置く S...

Google、人工知能をより有効活用できるよう複数のAIツールをリリース

Google は今週開催された Cloud Next カンファレンスで、さまざまな機械学習ツール、顧...

IT の現状レポート: IT リーダーの 90% が、生成型 AI がまもなく主流になると考えています

7月25日、海外メディアの報道によると、セールスフォース・ドットコムが発表したIT現状報告によると、...

...