中学校の知識を使って機械学習が何をしているのかを理解する方法

中学校の知識を使って機械学習が何をしているのかを理解する方法

[[333000]]

序文

Baidu 百科事典で「機械学習」を検索すると、私が決して到達できないレベルの達成度が見つかりました。

  • 機械学習は、確率論、統計、近似理論、凸解析、アルゴリズム複雑性理論など、多くの分野が関わる多分野にわたる学際的な科目です。コンピュータが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、既存の知識構造を再編成してパフォーマンスを継続的に向上させる方法を研究することに特化しています。

自分の IQ を疑っていたとき、私はこうも思っていました。機械学習は素晴らしいもので、人間の学習行動をシミュレートできると説明しているのに、この文章ではこの 4 つの単語の意味が理解できなかったようです。むしろ、精神的な負担が増えました。どんどん重くなる頭で読み進めていくと、このエントリで最も重要な定義と思われるものを見つけました。

でもそれは問題じゃない!!!

まるで『微笑む誇り高き放浪者』の「ひまわりマニュアル」を見ているようだ。去勢していないので、いくら高度な剣術を駆使しても一方的で、ただただすごいだけなのだ。この時点で、間違った方法で開けていたためであり、最初から間違っていた(自分自身を去勢しなければならなかった)ことがようやくわかりました。

そこで、やり方を変えて、今回は中学校の数学を使って開きます。

まずは線形関数から始めましょう

中学校の数学では、次のような問題によく遭遇します。

  • 平面上の 3 つの点の座標 (x, y) A(1,3)、B(2,5)、C(3,7) が与えられている場合、x=5 のときの y の値を求めます。

このような問題に直面した場合、まず図に示すように、3 つの点を座標軸上に配置して確認することができます。

3 つの点は直線上にあり、線形関数の特性に一致していることがわかります。次に、この直線の方程式を見つけ、方程式に x=5 を代入するだけで、この時点での y の値がわかります。

この時点で、疑問は次のようになります。

  • 3つの点A(1,3)、B(2,5)、C(3,7)が与えられた場合、水平座標と垂直座標の関係は線形関数に従います。

x=5 のときの y の値を求めます。

この時点で、問題は中学校レベルの知識になっています。3 つの点 A、B、C を y=kx+b に代入して k と b に関する連立方程式を作成し、それを解くと次のようになります。

そして、x=5 のとき、y は 2*5+1=11 になります (私に任せてください、計算できます)。

考えるべき質問

機械学習は、上記に似たプロセスに過ぎません。一定量の入力データ(x)と出力データ(y)が与えられたら、これらのxとyの関係を表す関数を見つけます。この関数に基づいて、xがわかっている条件下でyを簡単に計算できます。たとえば、オンラインで買い物をした後にコメントを入力すると、システムが自動的にそれが良いレビューか悪いレビューかを識別できます。

上記の場合の関数をモデル、x を特徴、y を機械学習で予測する結果、x と y の既知の組み合わせをトレーニング データと呼びます。トレーニング プロセスは、x と y の関係を見つけるプロセスです (ホイップするプロセスではありません)。

しかし、実際の機械学習のケースはそれほど単純ではないことがよくあります。 1 つの機能 x のみを持つ関数が、より複雑なビジネス ニーズをどのように満たすことができるのでしょうか。

「1つがダメなら、2つ。2つがダメなら、3つ。3つがダメなら、さらに追加できます。料金を支払うだけです。話がそれてすみません!」

複数の特徴がある場合でも、上記の線形関数の基礎に基づいてモデルの仮定を立てることができる。

これで問題は解決できます。これは機械学習におけるより基本的な線形回帰です。

これらの関数は値を計算するだけで意味がないと思われる場合は、どのコメントが適切で、どのコメントが適切でないかを識別するのを手伝ってもらえますか?

「もちろん問題ありません! y の結果を 0 から 1 の間にマッピングし、y を判断するだけです。y>=0.5 は良いレビューを意味し、y<0.5 は悪いレビューを意味します。このマッピング関数を活性化関数と呼びます。理解できれば、どのように実装するかは気にしません。」

これは、機械学習における分類タスクのロジスティック回帰を実装します。

1 つの特徴が 1 つの重みに対応し、その重みが少し低く、多くのものが線形関係にないと考えられる場合、この問題をどのように解決すればよいでしょうか?

「1 層の重量が足りない場合は、さらに追加します。それでも足りない場合は、さらに追加します。」


もっと欲しい?もう少し追加します

上記のプロセスはちょっと行き過ぎて、偶然にディープラーニングのレベルに到達しました。道のりは長くて困難で、私のIQは少し遅れています...(そのため、代わりに省略記号を使用します)

要約する

上記のケースは機械学習における教師あり学習のプロセスにすぎません。実際の機械学習はこれよりもはるかに複雑な場合が多いです。また、教師なし学習と半教師あり学習に分けられます。ここでは詳細には触れません。機会があれば書きます。ではまた!

<<:  機械学習は簡単になっていますが、ソフトウェア エンジニアリングは逆の方向に進んでいます...

>>:  DAMOアカデミーの医療AIは、整形外科手術における歴史的課題を解決し、解剖学的位置を0.3秒で特定します。

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

日本政府は国民が人生のパートナーを見つけるのを支援するためにAI技術を活用することを計画している

完璧なパートナーを見つけることは、特に新型コロナウイルスによるロックダウンや隔離により対面でのコミュ...

神経系とビッグデータ、新しい次元削減アルゴリズムが脳をシンプルにする

ネイチャー・ニューロサイエンス誌に掲載されたレビュー記事で、カーネギーメロン大学のバイロン・M・ユー...

ボストン大学の「Platypus-70B」がHugging Face大型模型ランキングでトップに!効率的なデータセットと独自のLoRA微調整が鍵

Hugging Faceのオープンソース大型モデルのランキングがまた更新されました。今回のランキング...

...

ドバイ、街頭にロボット警察を配備へ

ロシア・トゥデイTVのウェブサイトは20日、UAE当局者の発言を引用し、UAE初のロボット警察が今年...

AIのエネルギー消費は高すぎるため、マイクロソフトはデータセンターの電力供給に原子力発電の利用を検討している

9月26日のニュース: ここ数か月、マイクロソフトは人工知能 (AI) 事業の開発を加速させています...

トークンとメモリを理解することによってのみ、ChatGPT をよりよくマスターできます。

著者: ラセル・コーン編纂者:ヤン・ジェンChatGPT のような大規模言語モデル (LLM) は ...

...

食糧生産・供給システムの改善 — AI が担う時代へ!

[[344152]] 人工知能は私たちの世界を急速に、さらには加速的に変えつつあります。しかし、そ...

Midjourneyの隠されたスキルをアンロックする:プロンプトを変更すると、4つの正方形のグリッドが「分裂」します

Midjourney は多くの人が使用するグラフィック デザイン ツールです。最近アップデートされた...

モノのインターネットは単なるトレンドではなく、未来を形作る

今日、ますます多くの企業が IoT のメリットを活用しています。機械学習、人工知能、即時フィードバッ...

張亜琴:業界にとって、ディープラーニングの黄金時代は始まったばかりだ

本日、張亜琴教授はCNCC 2020で「スマートテクノロジーのトレンド」をテーマに講演しました。デジ...

...

...