中学校の知識を使って機械学習が何をしているのかを理解する方法

中学校の知識を使って機械学習が何をしているのかを理解する方法

[[333000]]

序文

Baidu 百科事典で「機械学習」を検索すると、私が決して到達できないレベルの達成度が見つかりました。

  • 機械学習は、確率論、統計、近似理論、凸解析、アルゴリズム複雑性理論など、多くの分野が関わる多分野にわたる学際的な科目です。コンピュータが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、既存の知識構造を再編成してパフォーマンスを継続的に向上させる方法を研究することに特化しています。

自分の IQ を疑っていたとき、私はこうも思っていました。機械学習は素晴らしいもので、人間の学習行動をシミュレートできると説明しているのに、この文章ではこの 4 つの単語の意味が理解できなかったようです。むしろ、精神的な負担が増えました。どんどん重くなる頭で読み進めていくと、このエントリで最も重要な定義と思われるものを見つけました。

でもそれは問題じゃない!!!

まるで『微笑む誇り高き放浪者』の「ひまわりマニュアル」を見ているようだ。去勢していないので、いくら高度な剣術を駆使しても一方的で、ただただすごいだけなのだ。この時点で、間違った方法で開けていたためであり、最初から間違っていた(自分自身を去勢しなければならなかった)ことがようやくわかりました。

そこで、やり方を変えて、今回は中学校の数学を使って開きます。

まずは線形関数から始めましょう

中学校の数学では、次のような問題によく遭遇します。

  • 平面上の 3 つの点の座標 (x, y) A(1,3)、B(2,5)、C(3,7) が与えられている場合、x=5 のときの y の値を求めます。

このような問題に直面した場合、まず図に示すように、3 つの点を座標軸上に配置して確認することができます。

3 つの点は直線上にあり、線形関数の特性に一致していることがわかります。次に、この直線の方程式を見つけ、方程式に x=5 を代入するだけで、この時点での y の値がわかります。

この時点で、疑問は次のようになります。

  • 3つの点A(1,3)、B(2,5)、C(3,7)が与えられた場合、水平座標と垂直座標の関係は線形関数に従います。

x=5 のときの y の値を求めます。

この時点で、問題は中学校レベルの知識になっています。3 つの点 A、B、C を y=kx+b に代入して k と b に関する連立方程式を作成し、それを解くと次のようになります。

そして、x=5 のとき、y は 2*5+1=11 になります (私に任せてください、計算できます)。

考えるべき質問

機械学習は、上記に似たプロセスに過ぎません。一定量の入力データ(x)と出力データ(y)が与えられたら、これらのxとyの関係を表す関数を見つけます。この関数に基づいて、xがわかっている条件下でyを簡単に計算できます。たとえば、オンラインで買い物をした後にコメントを入力すると、システムが自動的にそれが良いレビューか悪いレビューかを識別できます。

上記の場合の関数をモデル、x を特徴、y を機械学習で予測する結果、x と y の既知の組み合わせをトレーニング データと呼びます。トレーニング プロセスは、x と y の関係を見つけるプロセスです (ホイップするプロセスではありません)。

しかし、実際の機械学習のケースはそれほど単純ではないことがよくあります。 1 つの機能 x のみを持つ関数が、より複雑なビジネス ニーズをどのように満たすことができるのでしょうか。

「1つがダメなら、2つ。2つがダメなら、3つ。3つがダメなら、さらに追加できます。料金を支払うだけです。話がそれてすみません!」

複数の特徴がある場合でも、上記の線形関数の基礎に基づいてモデルの仮定を立てることができる。

これで問題は解決できます。これは機械学習におけるより基本的な線形回帰です。

これらの関数は値を計算するだけで意味がないと思われる場合は、どのコメントが適切で、どのコメントが適切でないかを識別するのを手伝ってもらえますか?

「もちろん問題ありません! y の結果を 0 から 1 の間にマッピングし、y を判断するだけです。y>=0.5 は良いレビューを意味し、y<0.5 は悪いレビューを意味します。このマッピング関数を活性化関数と呼びます。理解できれば、どのように実装するかは気にしません。」

これは、機械学習における分類タスクのロジスティック回帰を実装します。

1 つの特徴が 1 つの重みに対応し、その重みが少し低く、多くのものが線形関係にないと考えられる場合、この問題をどのように解決すればよいでしょうか?

「1 層の重量が足りない場合は、さらに追加します。それでも足りない場合は、さらに追加します。」


もっと欲しい?もう少し追加します

上記のプロセスはちょっと行き過ぎて、偶然にディープラーニングのレベルに到達しました。道のりは長くて困難で、私のIQは少し遅れています...(そのため、代わりに省略記号を使用します)

要約する

上記のケースは機械学習における教師あり学習のプロセスにすぎません。実際の機械学習はこれよりもはるかに複雑な場合が多いです。また、教師なし学習と半教師あり学習に分けられます。ここでは詳細には触れません。機会があれば書きます。ではまた!

<<:  機械学習は簡単になっていますが、ソフトウェア エンジニアリングは逆の方向に進んでいます...

>>:  DAMOアカデミーの医療AIは、整形外科手術における歴史的課題を解決し、解剖学的位置を0.3秒で特定します。

ブログ    

推薦する

アルゴリズム: Javascript をエレガントに使用して構造ツリーを再帰的に描画する方法

[[376839]]再帰と末尾再帰簡単に言えば、再帰とは関数が自分自身を呼び出すことです。プログラミ...

オリンピックのコーチたちが、人工知能によって職を奪われる危険に直面する番なのだろうか?

中国の飛び込みドリームチームは、「消える水しぶき」の技術に長けており、オリンピックのあらゆる大会で金...

...

...

...

人工知能、自動化、そして仕事の未来: 答えが必要な 10 の質問!

[[264418]]職場で機械が人間の労働に取って代わるようになるにつれ、私たち全員が機械から利益...

...

[文字列処理アルゴリズム] 最長共通部分文字列を取得するためのアルゴリズム設計とCコード実装

1. 要件の説明2 つの文字列を入力し、2 つの文字列の最長共通部分文字列を取得するプログラムを作成...

TIC 2018: クラウド サービスが人工知能の急速な発展を支援

[51CTO.comよりオリジナル記事] 中国の大手中立クラウドサービスプロバイダーUCloudが主...

Google 検索は年間 890 回以上改善され、そのコア アルゴリズムは毎日変更されます。

8月21日、Googleの検索事業責任者アミット・シンガル氏はGoogle+に記事を掲載し、過去1...

マスク氏の AI ツール Grok は ChatGPT のシェルですか?

イーロン・マスク氏の人工知能企業xAIは最近、GroKと呼ばれる人工知能チャットボットをリリースした...

...

プロフェッショナルスキルを向上させる: 10のNLPテクニックを理解して習得する

1. 感情分析感情分析とは、ツイート、製品レビュー、顧客からのフィードバックなどのテキストの背後にあ...

人工知能によって作られた、素晴らしい美しさと能力を持つ美しいロボット

我が国初の自主開発人工知能美容ロボットも誕生しました。その皮膚は先進的なシリコンで作られており、まる...