1. 先を行くNLP NLP 開発の歴史は非常に古く、コンピュータが発明されて以来、人々は言語処理を必要としてきました。コンピュータの歴史を通じて、さまざまな文字列アルゴリズムが使用されてきました。偉大なチョムスキーは、人間が言語を処理するための最も基本的なフレームワークである生成文法、オートマトン(正規表現)、ランダム文脈自由構文木、文字列マッチングアルゴリズム KMP、動的プログラミングを提唱しました。 スパム分類などのテキスト分類などの NLP タスクは非常に早い段階で成熟しており、Naive Bayes は優れた結果を達成できます。 20 年前は、純粋な統計と規則を使用して機械翻訳が可能でした。比較すると、CV 分野では、当時 MNIST 分類はまだ完了していませんでした。 1990 年代には、情報検索の発展により BM25 などの一連のテキスト マッチング アルゴリズムが提案され、Google などの検索エンジンの発展により NLP は頂点に達しました。 CV分野に比べると、ちょっと暗いですね。 2. 特徴抽出が難しいCV CVの前身は画像処理という分野で、画像の圧縮やフィルタリング、エッジ抽出などを研究し、レナという美女を毎日いじっていた。 コンピューター ビジョンの初期の分野では、特徴抽出の難しさに悩まされていました。HOG もさまざまな手動の特徴抽出方法も、あまり良い結果を達成できませんでした。 大規模な商用化は困難です。同時に、NLP における手動機能 + SVM が非常に人気になりました。 3. ディープラーニングの台頭 - 自動特徴抽出 近年、非常に人気のあるディープラーニング モデルは、次のように簡単にまとめることができます。 ディープラーニング = 特徴抽出器 + 分類器 これにより、CV では手動で特徴を抽出するのが難しいという問題が解決され、CV は爆発的に進歩しました。ディープラーニングの考え方は、モデルがデータから特徴抽出を自動的に学習し、手動で抽出するのが難しい多くの特徴を生成することです。 4. NLPの知識のジレンマ このディープラーニングの波の中で NLP が進歩していないわけではありませんが、そのブレークスルーは CV ほど大きくありません。多くのテキスト分類タスクでは、非常に複雑な双方向 LTSM を使用した場合の効果は、手動で特徴 + SVM を実行する場合とそれほど変わらない可能性があります。SVM は高速かつコンパクトで、大量のデータを必要とせず、GPU も必要ありません。多くのシナリオでは、ディープラーニング モデルは必ずしも SVM や GBDT などの従来のモデルよりも優れているわけではありません。 NLP のより大きな課題は、知識のジレンマにあります。 CV の知覚知能とは異なり、NLP は認知知能です。認知には必然的に知識の問題が伴い、知識は最も離散的で表現が難しいものです。 |
<<: AIと子ども経済が出会うとき、どうすれば中心的ポジションにデビューできるのか?
>>: Amazon SageMaker を使用した機械学習モデルのトレーニングとデプロイ
編集者注:この記事はWeChatの公開アカウントHaoge Says(ID:haogetalks)か...
人工知能は非常に複雑であり、急速に発展しています。今後数年間でそれがどうなるかを正確に予測することは...
翻訳者 |ブガッティレビュー | Chonglou AgentGPT Web は、ユーザーがカスタマ...
現在、世界の注目は5Gに集中しているが、人工知能の発展も軽視できない。わが国では、継続的な優遇政策の...
受動的な収集は防御が難しい一部の学校では、この技術を搭載したカメラを使用して、生徒の授業状況を監視し...
10月26日、「人工知能分野での中国初の上場企業」であるXiaoi RobotがHuazang Un...
製造業において、インダストリー 4.0 は単なる流行語ではなく、新たな現実となっています。新型コロナ...
新しいアプローチにより、機械学習モデルはタスクを学習する際により多くのデータに焦点を当てるようになり...
IT サービス デスクからデータ分析の最前線、新しいツール、戦略、関係まで、AI は IT 組織をど...
著者: 楊振、上級ソフトウェアエンジニア、アーキテクト、独立講師。ソフトウェア開発経験18年。『Et...
人工知能は今日最も注目されている流行語であり、その発展により企業や業界は情報に基づいた意思決定を行い...
索引多層パーセプトロン (MLP) 入門ディープニューラルネットワークの活性化関数ディープニューラル...
[[373822]] 2020年が終わりを迎えました。今年、人工知能(AI)分野は浮き沈みに富み、常...