ロボットはどのようにして深く学習するのでしょうか?論理的判断と感情的な選択は依然として障害となっている

ロボットはどのようにして深く学習するのでしょうか?論理的判断と感情的な選択は依然として障害となっている

[[187099]]

一人でいるときに少し寂しさを感じたらどうすればいいでしょうか?Microsoft Research Asiaが立ち上げた「Microsoft Xiaoice」は、親友のようにあなたとチャットして退屈を癒してくれるかもしれません。 「Xiaobing」バージョン3.0には、「外見を評価する」や「一致するアイテムを選択する」などの機能に加えて、ディープラーニング技術に基づく強力な視覚認識機能も備わっています。写真を見た後、感情に基づいて人間的な応答を返すことができ、応答速度は250ミリ秒に短縮されます。

これは、Microsoft XiaoIce や囲碁の名人 AlphaGo だけではありません。インターネット検索から言語翻訳、さらには自閉症のリスクを高める遺伝子の特定まで、大量のデータから未知の情報を予測する必要があるあらゆる分野で、ディープラーニングが活躍します。では、ディープラーニング技術とは何でしょうか? それは人間の生活をどのように変えるのでしょうか?

10,000枚の画像に重複した猫が見つかる

2011年、Google研究所の研究者らは、動画ウェブサイトから1000万枚の静止画像を抽出し、それをGoogle Brainに「入力」し、繰り返し現れるパターンを見つけることを目指した。 3日後、Google Brain は人間の助けを借りずにこれらの写真から「猫」を発見しました。

Google Brain は、ディープラーニング技術を使用し、1,000 台のコンピューターで構成される大規模なニューラル ネットワーク モデルです。この事件は当時のテクノロジー界でセンセーションを巻き起こし、ディープラーニング復活の画期的な出来事とみなされました。

いわゆるディープラーニングは、機械学習の機能を実現するために複数層のニューロンで構成されたニューラルネットワークです。これらの多層コンピュータ ネットワークは、人間の脳のように情報を収集し、収集した情報に基づいて対応するアクションを実行できます。

従来の機械学習方法では、一般的に、1 + 1 は 2 に等しいなどの単純な線形関係しか抽出できません。しかし、世界は、収入と年齢、性別、職業、教育水準などの単純な関係で説明できるものではありません。ディープラーニングの出現により、この状況は変わりました。ディープラーニングは、人間の脳のニューラルネットワークを模倣することに着想を得ています。

科学者たちは、人間の大脳皮質は網膜から送られたデータから直接特徴を抽出するのではなく、複雑なネットワークモデルを通じて受信した刺激信号をフィルタリングすることを発見しました。この階層構造により、ビジョン システムによって処理されるデータの量が大幅に削減され、最終的に有用な情報が保持されます。

1960年代、生物学者が猫の大脳皮質を研究していたとき、その独特なネットワーク構造がフィードバックニューラルネットワークの複雑さを効果的に軽減できることを発見し、「畳み込みニューラルネットワーク」を提唱しました。このネットワーク構造を使用して作成されたディープラーニング プログラムは適応性が高く、人工知能における画期的な進歩となっています。

音声認識は人間とコンピュータの相互作用を変える

簡単に言えば、ディープラーニング技術は人間の脳のシミュレーションであり、人間の脳が持つ多くの機能を実行できます。

最もよく知られているのは視覚機能です。カメラは人間の目のように世界を見ることができますが、人間の脳のように世界を理解することはできません。ディープラーニングはこの欠点を補います。 Baidu Image Recognition はディープラーニングを活用して、写真内のオブジェクトのカテゴリを正確に識別し、写真を自動的に分類または検索できます。ディープラーニングにより、顔をスキャンするだけで簡単に支払いができるようになります。ディープラーニングにより、特殊な機械が特定の空間内のすべての人や車両の所在を検出し、疑わしい危険な事件を即座に警告することができます。

同時に、ディープラーニング技術は音声認識にも広く使われています。ディープラーニングの助けにより、コンピューターの音声認識機能はますます強力になり、依然としてキーボードが主流となっている現在の人間とコンピューターの対話モードが変化する可能性があります。

強化学習と組み合わせたディープラーニングは、ロボット工学の分野に大きな変化をもたらしています。強化学習とは、ロボットが環境との相互作用で得られる報酬と罰を通じて、より良い戦略を自律的に学習することを指します。少し前に話題になった「アルファ碁」は強化学習の成果です。他のプレイヤーとチェスをしたり、自分自身と対戦したりして、勝敗から学習することで、よりよいチェス戦略を模索します。

ディープラーニングがさらに進化する理由

ただし、強力なニューラル ネットワークを作成するには、さらに多くの処理レイヤーが必要です。しかし、ハードウェアの制限により、初期の段階では 2 ~ 3 つのニューラル層しか生成できませんでした。では、ディープラーニングが他のものより優れている理由は何でしょうか?

明らかに、高性能コンピューティング機能の向上は大きな助けになります。近年の GPU (グラフィックス プロセッシング ユニット)、スーパーコンピューター、クラウド コンピューティングの急速な発展により、ディープラーニングが注目を集めるようになりました。 2011 年、Google Brain は 1,000 台のマシンと 16,000 個の CPU を使用して、約 10 億個のニューロンを持つディープラーニング モデルを処理しました。これで、同じ計算を複数の GPU で実行できるようになりました。

「ディープラーニングも、ロケットに燃料があるように、ビッグデータによってサポートされています。」DeepGlintのコンピュータービジョンエンジニアであり、清華大学オートメーション学部の博士号を持つパン・チェン氏は、ディープラーニング技術は、子供が現実世界から情報を収集するのと同じように、多数の事例に基づいていると述べた。さらに、より多くのデータが「与えられる」ほど、AI は賢くなり、「消化不良」に悩まされる可能性が低くなります。ビッグデータが不可欠であるため、現在ディープラーニングで最も力を入れている企業は、基本的にGoogle、Microsoft、Baiduなど、大量のデータを持つIT大手です。

現在、ディープラーニング技術は、音声認識、コンピュータービジョン、言語翻訳などの分野で従来の機械学習手法を打ち負かし、顔認証や画像分類では人間の認識能力を上回っています。専門家は、数年後には私たちのポケットの中の携帯電話が人間の脳と同じくらい複雑なニューラルネットワークを実行できるようになると予測しています。

しかし、現在の傾向から判断すると、ディープラーニング技術はまだ「舞台裏の監視室に座っている人々」に取って代わることはできません。たとえば、レストランで食事をした後、友達と急いで代金を支払おうとしている場合、スマートカメラでは、その押し合いが喧嘩なのか、それとも何か他のことなのかを判断するのは困難です。論理的判断と感情的な選択は、ディープラーニングにとって克服できない障害であることがわかります。

一目で悪者を判別できるシステム

コンピュータービジョンと人工知能に注力するテクノロジー企業DeepGlintは、ディープラーニング技術をベースに開発したインテリジェント認識システムを銀行のセキュリティ監視分野に適用します。

従来の光学レンズでは画像を認識する際に「奥行き」の次元が失われることを考慮して、DeepGlint は銀行のセキュリティ監視専用の 3 次元センサー セットを開発しました。その背後では、報酬と罰のメカニズムでトレーニングされたアルゴリズム モデルが、異常を積極的に特定できます。 「誰かが隣の空いているATMではなく、人が入っているATMに近づいているのを見たとき、その人の軌跡を特定し、その人の行動が正常かどうかを判断するにはディープラーニングが必要です」とMegviiのCEO、He Bofei氏は語った。システムが異常を検知すると、バックグラウンドのスーパーバイザーにそれをプッシュする。機械に正確な判断を教えるには、何十万もの画像データが必要です。

何博飛氏は、このインテリジェント認識システムに横顔や顔のない全身写真を与えれば、99%以上の精度で素早く対象物をロックオンできると指摘した。前提として、6,000 ~ 15,000 個のサンプルのサンプル ライブラリを構築します。「サンプルが *** に達すると、精度が 20% 以上低下する可能性があります。」

<<:  将来ロボットは人間の皮膚を持つようになるかもしれないが、その外見はかなり恐ろしい

>>:  知能ロボットは人間との交流を終わらせるのでしょうか?

ブログ    

推薦する

5G+AI: 未来に影響を与える新たなトレンド

7月9日、2020年世界人工知能会議クラウドサミットが正式に開幕しました。 AI という SF 用語...

AI 開発者の高額給与は魅力的すぎるでしょうか?国内の開発者がAIに変革するためのガイドをぜひご利用ください

著者注: AI関連のニュースを閲覧すると、「高給」「年収100万ドル」など、非常に魅力的な言葉が頻繁...

市場規模は約16.8億元に達しました!物流と配送がドローンと出会う

現在、ナビゲーションや通信などの技術が継続的に進歩し、ドローンの開発はより成熟し、業界の規模も拡大し...

2022年までのビッグモデルの未来を展望し、周志華、唐潔、楊紅霞といったビッグネームはどう考えているのだろうか?

年末から年始にかけて、ビッグモデルの過去を振り返り、ビッグモデルの未来に期待してみましょう。 28日...

機械学習が量子加速を実現、AI研究のパラダイムが完全に変わる可能性

最近、 Quanta Magazineに掲載された記事では、機械学習が量子加速を実現したと指摘されま...

金融保険業界における人工知能の3つの重要なトレンド

[51CTO.com クイック翻訳] 変化は常に起こっており、将来の変化は予測可能です。保険市場は大...

次世代人工知能の開発方向(第1部)

[[349500]]人工知能は半世紀以上前から存在していますが、人工知能の分野は過去 10 年間で...

1 つの記事で理解する: 「コンピューター ビジョン」とは一体何でしょうか?

[[183558]]誰かがあなたにボールを投げてきたら、どうしますか? もちろん、すぐにキャッチす...

AIに関する哲学的考察 - 認知不変性とAI

米国国防高等研究計画局(DARPA)はかつて、第3波AIの概念を提唱しました。その議論では、第3波A...

...

SDNアプリケーションルーティングアルゴリズムを実装するためのツールであるNetworkx

SDN (ソフトウェア定義ネットワーク) は、集中制御プレーンを通じてデータ層転送やその他の操作を...

張北院士:生成型人工知能の3つの大きな機能と1つの大きな欠点

網易科技は1月16日、知普AI技術公開デーで中国科学院院士で清華大学教授の張北氏が「大規模言語モデル...

Google の家庭用ロボットがスタンフォード大学のエビ揚げロボットに挑む!猫と遊ぶためにお茶と水を出し、3回続けてフリックして猫と遊ぶ

インターネット上で話題となったスタンフォード大学のエビ揚げロボットは、1日で人気が急上昇した。結局の...

垂直型AIスタートアップと水平型AIスタートアップ: 異なる製品ルートの選択

AIスタートアップは主に2つのスタイルに分けられます。本日の記事では、その両方を分析して見ていきます...