中学校の知識を使って機械学習が何をしているのかを理解する方法

中学校の知識を使って機械学習が何をしているのかを理解する方法

[[333000]]

序文

Baidu 百科事典で「機械学習」を検索すると、私が決して到達できないレベルの達成度が見つかりました。

  • 機械学習は、確率論、統計、近似理論、凸解析、アルゴリズム複雑性理論など、多くの分野が関わる多分野にわたる学際的な科目です。コンピュータが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、既存の知識構造を再編成してパフォーマンスを継続的に向上させる方法を研究することに特化しています。

自分の IQ を疑っていたとき、私はこうも思っていました。機械学習は素晴らしいもので、人間の学習行動をシミュレートできると説明しているのに、この文章ではこの 4 つの単語の意味が理解できなかったようです。むしろ、精神的な負担が増えました。どんどん重くなる頭で読み進めていくと、このエントリで最も重要な定義と思われるものを見つけました。

でもそれは問題じゃない!!!

まるで『微笑む誇り高き放浪者』の「ひまわりマニュアル」を見ているようだ。去勢していないので、いくら高度な剣術を駆使しても一方的で、ただただすごいだけなのだ。この時点で、間違った方法で開けていたためであり、最初から間違っていた(自分自身を去勢しなければならなかった)ことがようやくわかりました。

そこで、やり方を変えて、今回は中学校の数学を使って開きます。

まずは線形関数から始めましょう

中学校の数学では、次のような問題によく遭遇します。

  • 平面上の 3 つの点の座標 (x, y) A(1,3)、B(2,5)、C(3,7) が与えられている場合、x=5 のときの y の値を求めます。

このような問題に直面した場合、まず図に示すように、3 つの点を座標軸上に配置して確認することができます。

3 つの点は直線上にあり、線形関数の特性に一致していることがわかります。次に、この直線の方程式を見つけ、方程式に x=5 を代入するだけで、この時点での y の値がわかります。

この時点で、疑問は次のようになります。

  • 3つの点A(1,3)、B(2,5)、C(3,7)が与えられた場合、水平座標と垂直座標の関係は線形関数に従います。

x=5 のときの y の値を求めます。

この時点で、問題は中学校レベルの知識になっています。3 つの点 A、B、C を y=kx+b に代入して k と b に関する連立方程式を作成し、それを解くと次のようになります。

そして、x=5 のとき、y は 2*5+1=11 になります (私に任せてください、計算できます)。

考えるべき質問

機械学習は、上記に似たプロセスに過ぎません。一定量の入力データ(x)と出力データ(y)が与えられたら、これらのxとyの関係を表す関数を見つけます。この関数に基づいて、xがわかっている条件下でyを簡単に計算できます。たとえば、オンラインで買い物をした後にコメントを入力すると、システムが自動的にそれが良いレビューか悪いレビューかを識別できます。

上記の場合の関数をモデル、x を特徴、y を機械学習で予測する結果、x と y の既知の組み合わせをトレーニング データと呼びます。トレーニング プロセスは、x と y の関係を見つけるプロセスです (ホイップするプロセスではありません)。

しかし、実際の機械学習のケースはそれほど単純ではないことがよくあります。 1 つの機能 x のみを持つ関数が、より複雑なビジネス ニーズをどのように満たすことができるのでしょうか。

「1つがダメなら、2つ。2つがダメなら、3つ。3つがダメなら、さらに追加できます。料金を支払うだけです。話がそれてすみません!」

複数の特徴がある場合でも、上記の線形関数の基礎に基づいてモデルの仮定を立てることができる。

これで問題は解決できます。これは機械学習におけるより基本的な線形回帰です。

これらの関数は値を計算するだけで意味がないと思われる場合は、どのコメントが適切で、どのコメントが適切でないかを識別するのを手伝ってもらえますか?

「もちろん問題ありません! y の結果を 0 から 1 の間にマッピングし、y を判断するだけです。y>=0.5 は良いレビューを意味し、y<0.5 は悪いレビューを意味します。このマッピング関数を活性化関数と呼びます。理解できれば、どのように実装するかは気にしません。」

これは、機械学習における分類タスクのロジスティック回帰を実装します。

1 つの特徴が 1 つの重みに対応し、その重みが少し低く、多くのものが線形関係にないと考えられる場合、この問題をどのように解決すればよいでしょうか?

「1 層の重量が足りない場合は、さらに追加します。それでも足りない場合は、さらに追加します。」


もっと欲しい?もう少し追加します

上記のプロセスはちょっと行き過ぎて、偶然にディープラーニングのレベルに到達しました。道のりは長くて困難で、私のIQは少し遅れています...(そのため、代わりに省略記号を使用します)

要約する

上記のケースは機械学習における教師あり学習のプロセスにすぎません。実際の機械学習はこれよりもはるかに複雑な場合が多いです。また、教師なし学習と半教師あり学習に分けられます。ここでは詳細には触れません。機会があれば書きます。ではまた!

<<:  機械学習は簡単になっていますが、ソフトウェア エンジニアリングは逆の方向に進んでいます...

>>:  DAMOアカデミーの医療AIは、整形外科手術における歴史的課題を解決し、解剖学的位置を0.3秒で特定します。

ブログ    
ブログ    

推薦する

機械学習と予測アプリケーションに必要な50のAPI

[[231536]] API は、ソフトウェア プログラムを構築するためのプロトコルとツールのセッ...

ディープラーニングの面接で知っておくべきこと

[[208646]]この記事は、「ディープラーニングの面接で知っておくべきことは何ですか」という質問...

調査によると、AIツールは企業の従業員が年間約400時間を節約するのに役立つことがわかった

7月10日、人材分析・計画会社Visierは、英国、米国、カナダ、ドイツの250社以上の企業の従業員...

ヴィーナステックのヤン・ワンジア氏:人工知能を活用した産業用インターネットセキュリティの開発促進に関する提案

1. 問題と原因の分析インダストリアル インターネットは、新世代の情報通信技術と高度な製造技術の深い...

2022 年の AI 開発とイノベーションのトップ 10 トレンド

イノベーションは終わりがなく、人工知能(AI) などのテクノロジーが静かに世界を変えています。人工知...

ユーザーエクスペリエンスは過去のものになりました。AIは国民、さらには社会の視点から問題を考える必要があります。

今日、テクノロジーの巨人とその AI ベースのデジタル プラットフォームおよびソリューションは、世界...

Python が機械学習プロジェクトに最適な言語である理由は何ですか?

[[386401]] Python は安定性とメンテナンスのしやすさから、常に優れたパフォーマンス...

...

ViT以外にも、美団、浙江大学などが、視覚タスクのための統合アーキテクチャであるVisionLLAMAを提案した。

過去 6 か月間にわたり、Meta のオープン ソース LLaMA アーキテクチャはテストされ、LL...

...

MITの画期的技術トップ10

MITテクノロジーレビューは毎年、その年の「トップ10のブレークスルーテクノロジー」を選出していま...

新しい研究:ハトは人工知能と同様の方法で問題を解決する

オハイオ州立大学とアイオワ大学の研究者による研究で、ハトは問題を解決する際に人工知能に似た「力ずく」...

...

人工知能の波で私たちは職を失うのでしょうか?

[[200388]]概要: 私たちの仕事が機械に置き換えられるのはいつでしょうか? 最も危険な仕事...

AI はどのようにして人間の会話の内容を認識するのでしょうか?マイクロソフト研究チームがお伝えします

[[280027]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...