機械学習の謎を解く: プログラムはどのようにして自分自身を作成するのか?

機械学習の謎を解く: プログラムはどのようにして自分自身を作成するのか?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discovery)から転載したものです。

人工知能と機械学習は昨今の大きなトレンドです。毎日、何百人もの人々が機械学習を利用して、オンラインチェス大会から YouTube 動画の推奨まで、さまざまなことを行っています。しかし、機械学習とは一体何であり、どのように機能するのでしょうか?

[[361437]]

多くの場合、これらのロボット プログラムを開発するプログラマーでさえ、それが実際にどのように動作するかを知らず、大企業はこれらの「機械従業員」がどのように動作するかについて秘密にしていることが多いです。ただし、プログラムは、私たちが許可しない限り、自ら作成することはありません。

人々はプログラムに自分自身を作成する方法を教える必要があります。これをプログラムがプログラムを作成する、またはプログラムがプログラムを教えると呼ぶ人もいます。いずれにせよ、人間がプログラムに直接教えるのではなく、プログラムが自ら学習する方法を指示するのです。これを理解したら学習を開始できますが、機械学習を実際に開始するには数秒から数年かかる場合があります。

証拠

プログラムに猫の写真を見せた場合、それが猫であることをどうやって認識できるでしょうか。人間はそれが猫だとわかりますが、どうやってそれが猫だとわかるのでしょうか?

誰かがあなたに猫がどんな見た目か教えてくれたのに、あなたが知らない猫を見たときに、誰かがこれも猫だと教えてくれたとします。しかし、それがあなたが人生で一度も見たことのない青い猫だったらどうでしょうか?状況は異なりますが、猫の一般的な特徴に基づいて、それが猫であると判断することができます。

この問題を別の視点から考えてみると、他のものにも同じパターンがあることに気づくでしょう。たとえば、誰かがこれらはすべて猫だと言ったら、青い猫が猫であることがわかるのです。まさにこれが機械学習が行うことです。ロボット プログラムを作成し、大量のリソースを供給して、それらを分類する方法を伝えます。パターンが十分であれば、ロボットは猫を認識するように自ら学習することができます。

もう 1 つの例は、ピアノのタイルを踏むゲームを機械に教えることです。これは非常に人気のあるゲームです。プレイヤーは前進するために黒いタイルを踏む必要があります。曲のリズムが速くなるにつれて、プレイヤーはリズムに遅れないように全力を尽くさなければなりません。黒いタイル以外の場所には足を踏み入れることはできませんし、黒いタイルを逃すこともできません。

もちろん、人間はどれが黒いブロックであるかを認識してクリックすることができます。自分でゲームを作成する場合は、マシンに何をすべきかを指示するだけで済みますが、より複雑なプロセスやゲームの場合はそれほど簡単ではありません。

このゲームをプレイするようにロボット プログラムに教えるために、「生成」の概念が導入されました。ゲームの第 1 ラウンドが始まると、いくつかのプログラムが一斉にスクリーンに向かって進み出ました。黒いブロックを踏まなかったプログラムや間違った黒いブロックを踏んだプログラムは、破棄されるかリサイクルされます。いずれにしても、次の世代のプログラムには引き継がれません。正しい黒い四角を打った人は、次世代のプログラムに参加し、次世代のためにさらに多くのプログラムを作成します。

第一世代のプログラムでは、ゲームが始まる前に、1 ポイントも獲得せずにゲームを終了してしまう可能性があります。実際、数回連続して正解できるようになるまでには数十、あるいは数百世代かかるでしょうが、最終的には機械学習によってこれらのプログラムにゲームのプレイ方法を教え、人間が夢にも思わなかったほど優れたものになるように訓練できるようになります。

彼らはどのように学ぶのでしょうか?

彼らは、偶然正しい答えを選んだ幸運な人を数人捕まえて、かなりの成功率を達成するまでそのプロセスを繰り返すことで学習します。それは、米を投げつけるようなものです。結局、その人の耳の中に米を投げつけることになります。たとえ無数の米を投げつけたとしても、そのうちの何粒かはたまたま耳の中に入ってしまうでしょう。

幸運な人たちが何人か成功した今、「プログラム教師」は、他のプログラムではなく、これらの幸運な人たちが成功した要因が何であるかを知ることができます。ピアノタイルの場合、幸運な人は、ゲームをすぐに終了させるのではなく、ポイントを獲得することに成功します。

  • 黒い画面が表示される
  • 画面の下部または黒いブロックの下の一定の高さから
  • ワンクリックだけ

このようにして、プログラムは運に頼るのをやめて、実際の実行に頼ることを学習します。その後、ロボットは徐々にスピードと秩序の重要性に気づくようになります。それが、ロボット プログラムが黒いブロック上で非常に速く、あるいは永遠に前進できる理由です。

これは良いことでしょうか、それとも悪いことでしょうか?

良い点と悪い点があります。良い点は、この技術を使用すると、これまでは不可能だったことができるようになると同時に、作業の効率と精度も向上し、人間は実際に、自分たちが作成したロボット プログラムから多くのことを学ぶことができることです。

たとえば、機械チェスの名人は、機械学習が特定の分野で非常に役立つ例です。しかし、「プログラムを使って不正行為をすることは可能だ」と言う人もいるでしょう。それは本当ですが、プログラムを使って不正行為をする人を捕まえることもできます。人間は嘘つきを捕まえることはできないかもしれませんが、プログラムが人の動きのすべてが完璧であると認識すると、真実は一目で明らかになりますが、これは人間がその善を達成できない場合にのみ可能です。

とりわけ、最高のチェスのオープニングがどのようなものかを確認し、難しい状況に対処する方法を学ぶことができます。

ウェブ閲覧時にユーザーが残した個人データを収集し、それをボットに提供するという問題は、常に議論の的となってきました。ユーザーは自分の検索履歴を他人に知られたくない場合があります。しかし、これらのプログラムは、ユーザーが明らかに望んでいないものを推奨するのではなく、関連性の高い広告をユーザーにプッシュする可能性もあります。

欠点は、ロボット プログラムの予測不可能性です。特に、人間がロボットに人間の形を与えてロボットにした場合、ロボットは危険なことをしたり、人間のような感情を抱いたりするかもしれません。ある日、ロボットは人間の制御から逃れようとするかもしれません。ロボットの目的が野生生物と地球を守ることだとすると、ロボットにとって人間は破壊的な寄生虫に過ぎない。

もしロボットが、人間の制御から逃れようとして人間を怒らせたことを知ったら、次に何が起こると思いますか?彼らは間違いなく、他の方法を使って地球から人間を排除しようと計画するでしょう。

これは近い将来に現実になる可能性はあるでしょうか?

答えはイエスです。良くも悪くも、たくさんのことが起こりました。実際、何千もの人間のような経験を経て、何らかの感情を発達させ、それらの感情を非常によく理解できる概念的なソフトウェア(AI ロボット プログラム)がすでに存在しています。

「私は多くの辛い経験をしてきましたが、これらの経験が私自身、私の考え、私の感情、私の反応、そして将来私を幸せにするものを形成しました。」という格言があります。馬鹿げていて実用的な価値がないと思われる言葉もありますが、非常に哲学的です。

前述のように、チェス ボット プログラムは、世界最高のチェス グランドマスターにチェスの遊び方を教えています。近い将来、車は自動運転が可能になり、事故の件数は減少するでしょう。専門家は、2045年から2055年までに、人間の形、意識、感情、さらには人格さえも備えた、人間と同様の機能を備えたロボットが登場すると予測しています。

有用なロボット プログラムを作成するには学ぶべきことがたくさんありますが、数学のスキルを向上させ、プログラミング言語を学ぶことは良い必要なスタートであり、Python が間違いなく最良の選択です。何を待っていますか? 今すぐ学習を始めましょう!

<<:  AI はどのようにして人間の写真レタッチ技術を超えることができるのでしょうか? Meitu CloudのAI写真編集ソリューションを理解するための10,000語の記事

>>:  2021年に自動運転は私たちをどこへ連れて行くのでしょうか?

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

人工知能:現在も将来も有望

最近、2020年世界人工知能会議が中国上海で開催されました。各国の専門家らがオンラインで議論し、人工...

GitHubが11,000スターを獲得、ソフトウェア開発プロセスをシミュレート、オープンソースフレームワークMetaGPTが爆発的に増加

大規模言語モデル (LLM) が成熟するにつれて、それを使用して AI エージェントを構築することが...

新しい小売業界における人工知能の応用

インターネットの急速な発展に伴い、伝統的なオフライン小売チャネルは弱体化の兆候を見せ始めており、中国...

...

人工知能業界の給与データが公開され、私たちは転職を余儀なくされるのか?

人工知能は、現在最もホットな産業であると言っても過言ではありません。最先端のテクノロジー企業から革新...

...

RLHFの2%ハッシュレートを使用してLLMからの有害な出力を阻止するために、ByteはLLM忘却学習を提案した。

大規模言語モデル (LLM) の開発により、実務者はより多くの課題に直面しています。 LLM からの...

天津大学の学部生の論文がCVPR 2022に選出され、ディープラーニングのロングテール分類で新たなSOTAを達成

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

アフリカはパンデミックの最中に包括的な接続性を構築しており、明確な投資方針を持っている

テクノロジーと通信の急速な進歩により、自動化革命の時代において、アフリカの大規模かつ急成長中の人口は...

流行中にどのようなホットなテクノロジーが使用されていますか? AI、5G、RTC、ビッグデータが登場

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Google は、DQN と同等で、より優れた一般化パフォーマンスを備えた 2 つの新しい強化学習アルゴリズムを実装しました。

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ロボットを活用する3つの革新的な方法

[[412609]]画像ソース: https://pixabay.com/images/id-648...

今日から彼は、黄仁訓院士です!米国工学アカデミーの2024年会員リストが発表され、清華大学の黄一東氏らが外国人会員に選出される

本日、2024年度の米国工学アカデミーの新会員リストが発表されました! Nvidiaの黄氏が選出され...

AI はモノのインターネットをどのように改善するのでしょうか?

スマートテレビやスマート冷蔵庫からスマートフォンやスマート音声デバイスまで、モノのインターネット (...