【51CTO.com クイック翻訳】 ディープラーニングが泡のようなものだとしたら、それを真に制御するためには、その曲率と屈折の原理を理解する必要があります。
今日、機械学習は私たちの行動、傾向、相互作用、コミュニケーションの反応を観察し始めています。ディープラーニングは機械学習の開発における次のステップです。ディープラーニングは従来、機械学習プログラムがテキストデータを習得するのを支援するために使用されてきましたが、現在では、ビデオ、オーディオ、音楽、画像、センサーデータなどのより複雑なコンテンツ形式から情報を抽出しようとする試みも始まっています。 コンピュータービジョン認識、人間認識、音声認識、自然言語処理など、これらはすべて「建設的な」テクノロジーアプリケーションの例となっています。このツールが画期的なのは、単に事前に保存された履歴データを呼び出すだけでなく、学習経験に基づいて、発見したデータや物理的なオブジェクトさえも変更、復元、注釈付けできる点です。 実際、ディープラーニング分析は、実際のデータ内の実際のパターンを識別することを目的としています。この構築能力が、経験を要約したり、計画を立てたり、歴史を記録したりするのに応用され、さらには驚くほどリアルに私たちの体にフィードバックされることができれば、現実と空想の境界線は非常に曖昧になるでしょう。おそらくある日、私たちは予算法を経験の基礎として採用し、人間の自己認識の感覚を完全に失ってしまうのでしょうか? これは形而上学的な性質の瞑想ではありません。実際、ディープラーニングはすでに次の段階に達しています。 消えた画像、ぼやけた画像、または誤解を招く画像に基づいて新しい要素を生成し、元の視覚要素の上に重ね合わせることで、画像の自動修正を実現できます。 どんなに粗雑な落書きでも、人間の芸術家が現実世界を描く方法に近い印象的な絵に変換できます。 手描きの顔の設計図は、アルゴリズムを通じてリアルな画像に変換できます。 低解像度のオリジナル画像を自然な高解像度バージョンに変換できます。 コンピュータは、特定の人間のアーティストのスタイルを表現しながら、任意の画像を描くように指示することができます。 基本的に、ソースコードに存在しないパターンや文字、その他の詳細な画像を直接呼び出すことができます。 実際の読者や専門家の見解に近い、画像やその他のコンテンツのキャプションと注釈を自動的に生成します。 コンピューターで生成された音声は、人間が話すのと同じくらい自然にレンダリングされ、聞こえます。 これにより、コンピューターは人間のミュージシャンの作品と同様に、本物の感情を表現する音楽を生成できるようになります。 義肢、有機分子、3D プリント、CRISPR、その他の新興技術を含む、幅広い機能的な物理的オブジェクトを作成する能力。 明らかに、この構築能力は再構築にも反映される可能性があり、それはディープラーニングが創造し、誤解させる能力を持っていることを意味します。誇大宣伝はさておき、ディープラーニングの再構築の可能性は認知問題において実証されており、クラウド意思決定サポートの基本的なアルゴリズムの基盤にもなっています。しかし、これらの再構築アルゴリズムが実際の環境と大きく異なる場合、特に自動運転車や義肢設計などの分野におけるディープラーニングの応用を考えると、実際のアプリケーションには大きなリスクが生じる可能性があります。 ディープラーニングが私たちの生活の一部になることを止めることはできませんが、その透明性を高めることはできます。つまり、これらのアルゴリズムがどのように独自の判断を下すかを理解できるのです。ディープラーニング アプリケーションにおける特定のアルゴリズムの認識プロセス (たとえば、ソース情報からエンドツーエンドのグラフ変換、統計モデル、さらにはメタデータまで) を調べ、特定の方法と特定の状況下で特定のアクションを実行する方法を理解する必要があります。 また、アルゴリズムの結論と現実を常に比較し、両者の矛盾を指摘し、それらの相互作用を考慮することも重要です。つまり、ディープラーニングを泡に例えると、それを真に制御するには、その曲率と屈折の原理を理解する必要があります。 原題: ディープラーニングはすでに現実を変えている 原作者: ジェームズ・コビエルス [51CTOによる翻訳。パートナーサイトに転載する場合は、元の翻訳者と出典を51CTO.comとして明記してください] |
<<: 最適化されたアルゴリズムによる高度なデータ分析に視覚化を活用する 5 つのステップ
8月25日〜26日、第1回中国認知コンピューティングおよびハイブリッドインテリジェンス学術会議が西安...
1G の時代では、電話をかけたり受けたりすることしかできませんでした。 2G 時代は、電話をかけた...
[[176714]] Objective-C を使用していくつかの基本的なソート アルゴリズムを実装...
現在、GPT-4 Vision は言語理解と視覚処理において並外れた能力を発揮しています。ただし、パ...
NVIDIA は最近、AI 駆動型イメージング、ゲノミクス、スマート センサーの開発と展開のための...
翻訳者 | 李睿校正:孫淑娟第三者が機械学習モデルを提供し、そこに悪意のあるバックドアを密かに埋め込...
近年の人工知能の発展スピードは驚異的で、あらゆる分野で専門的なAIが登場しています。上海では以前、無...
人間の子どもの最も基本的な運動知能、例えばつかむ、持ち上げる、あるいはキルトや衣服をたたむといった家...
最近、天津大学の熊徳一教授のチームが大規模言語モデルアライメント技術に関するレビュー論文(以下、アラ...
最近、AI技術を使ってアテナ・チュウ演じる黄容の顔を楊冪の顔に置き換える動画が話題になった。ネットユ...
人工知能プロセッサは世界の半導体産業を活性化させており、少なくとも1つの市場調査会社は、AIチップの...
Linux SNMP を十分に学習したい場合は、いくつかのモジュールに精通している必要があります。そ...
脳信号から対応する視覚刺激を再構築することは、意義深く困難な作業です。これまでの研究では、一部の自然...
[[340820]] [51CTO.com クイック翻訳] 過去10年間、人工知能をめぐって大きな議...
IT Homeは1月15日、Google Researchが最近、独自のBIG-Benchベンチマ...