「自然言語処理」とは何ですか? 具体的に何を「処理」するのですか?

「自然言語処理」とは何ですか? 具体的に何を「処理」するのですか?

[51CTO.com からのオリジナル記事] 「自然言語処理」(NLP) は、近年テクノロジー コミュニティで最もホットな用語の 1 つであり、人工知能研究の最もホットな分野の 1 つでもあります。自然言語処理は、言語インテリジェンスの継続的な発展と進歩を推進しており、さまざまな業界でますます使用されるようになっています。国際的に著名な学者である周海中氏はかつてこう言いました。「自然言語処理は、理論的意義と実用的価値が非常に高い、非常に魅力的な研究分野です。」

[[377428]]

では、NLP とは一体何でしょうか。NLP は一体何を「処理」しているのでしょうか。これらの質問は議論と注目に値します。いわゆる NLP は、コンピュータ サイエンスと人工知能の分野における重要な方向性であり、自然言語を使用して人間とコンピュータ間の効果的なコミュニケーションを可能にするさまざまな理論と方法を研究します。 NLP は主に、機械翻訳、音声認識、知識回答、自動要約、世論監視、意見抽出、知識ベース構築、テキスト意味比較、ディープラーニングアルゴリズム、音声認識および合成などに使用されます。したがって、NLP は革命的な理論的意義だけでなく、非常に重要な実用的応用意義も持っています。

人間とコンピュータの間で自然言語によるコミュニケーションを実現するということは、コンピュータが自然言語テキストの意味を理解し、与えられた意図や考えなどを自然言語テキストで表現できるようにすることを意味します。前者は自然言語理解と呼ばれ、後者は自然言語生成と呼ばれます。したがって、NLP には通常、自然言語理解と自然言語生成という 2 つの部分が含まれます。自然言語を処理するための鍵は、コンピューターに自然言語を「理解」させることであるため、自然言語理解は通常、NLP (計算言語学とも呼ばれる) と見なされます。その究極の目標は、自然言語を使用してコンピューターと通信することです。これにより、人々は、あまり自然ではなく慣れていないさまざまなコンピューター言語を学習するために多くの時間と労力を費やすことなく、最も慣れている言語でコンピューターを使用できるようになります。

NLP は人工知能における最も難しい問題の 1 つです。マイクロソフトの創設者ビル・ゲイツ氏はかつて「言語理解は人工知能の分野における最高の技術である」と語った。マイクロソフトの元グローバル執行副社長ハリー・シャム氏も演説でこう語った。「言語を理解する者が世界を制するだろう。次の10年間、人工知能の躍進は自然言語の理解にあるだろう。人工知能が人間に与える最も大きな影響は自然言語の分野にある。」自然言語を理解するには、外部世界に関する広範な知識と、その知識に基づいて操作する能力が必要であるため、NLP は AI 完全な問題を解決するための中核的な課題の 1 つとしても考えられています。

NLP の基本的なタスクには、正規表現、単語の分割、語彙解析、音声認識、テキスト分類、情報検索、質問応答システム (質問への回答やユーザーとの対話など)、機械翻訳などがあります。一般的に使用されるモデルには、マルコフ モデル、ナイーブ ベイズ、リカレント ニューラル ネットワークなどがあります。 NLP には言語知識が必要です。たとえば、UNIX の wc プログラムを使用すると、テキスト ファイル内のバイト数、単語数、行数をカウントできます。バイト数や行数をカウントする場合、wc は一般的なデータ処理にのみ使用されますが、ファイル内の単語数をカウントする場合、「単語とは何か」に関する言語知識が必要です。このように、この wc は NLP システムになります。

自然言語理解であれ、自然言語生成であれ、それは人々が当初想像していたほど単純ではなく、非常に困難です。現在の理論的および技術的状況から判断すると、汎用的で高品質の NLP システムはまだ長期的な目標です。ただし、特定のアプリケーションでは、かなりの NLP 機能を備えた実用的なシステムがすでに登場しており、そのいくつかは商用化され、産業化も始まって​​います。代表的な例としては、多言語データベースやエキスパートシステムの自然言語インターフェース、各種機械翻訳システム、全文情報検索システム、自動要約システムなどが挙げられます。 NLP システムのアルゴリズムは機械学習、特に統計的機械学習に基づいており、さまざまな種類の機械学習アルゴリズムが NLP タスクに適用されてきました。

ディープラーニングはNLPで広く使用されています。NLPのあらゆる側面をカバーしていると言えます。基礎となる単語分割、言語モデル、構文解析から、高レベルの意味理解、対話管理、知識質問と回答まで、ほぼすべての側面にディープラーニングモデルがあり、優れた成果を上げています。研究は、従来の機械学習アルゴリズムから、畳み込みニューラル ネットワークや再帰型ニューラル ネットワークなどのより表現力豊かなディープラーニング モデルへと移行しています。しかし、現在のディープラーニング技術には、自然言語を理解して使用するために必要な概念の抽象化と論理的推論機能がまだ備わっておらず、今後さらなる研究が必要です。

まとめると、インターネットの普及と大量の情報の出現により、人工知能の中核技術であるNLPは人々の仕事、学習、生活においてますます重要な役割を果たしており、社会の発展と科学技術の進歩のプロセスにおいてもますます重要な役割を果たすことになるでしょう。

[51CTO オリジナル記事、パートナーサイトに転載する場合は、元の著者とソースを 51CTO.com として明記してください]

<<:  Python 実用コード - 無限分類ツリー構造生成アルゴリズム

>>:  上位 10 の古典的なソート アルゴリズムの詳細な説明: バブル ソート、選択ソート、挿入ソート

ブログ    
ブログ    
ブログ    

推薦する

エラー分析を正しく行う方法、NLP研究者は学ぶ必要がある

著者注:機械学習モデルがいつ、どのように、なぜ失敗するかを分析することを「エラー分析」と呼びます。科...

全人代副代表の馬化騰氏は8つの書面提案を提出し、ブロックチェーンや人工知能など17の質問に答えた。

[[221404]] 3月3日午後9時30分、全国人民代表大会の代表でテンセント会長の馬化騰氏が黒...

2021年に人工知能の倫理的問題、社会的価値、影響について読むべき8冊の本

[[387639]]人工知能に関するこれらの 8 冊の本は、AI に関連する倫理的問題、AI が雇用...

...

「無人運転」について、投資界の大物が4つの大きな予測を示した

編集者注: Chentao CapitalのエグゼクティブゼネラルマネージャーであるHe Xiong...

人工知能に置き換えられる可能性が最も高い 12 の職業、あなたの職業もその中に含まれていますか?

AlphaGo が囲碁の名人に勝利し、百度の無人自動車が第五環状線を走行し、マイクロソフトの Xi...

人工知能はよりクールで実用的

2021年は間違いなく人工知能産業の発展にとって重要な年となるでしょう。わが国のスマートシティ建設の...

NLPer が仕事に戻りました! 2019年の機械学習とNLPの年次レビューを見てみましょう

2019年は機械学習と自然言語処理の分野で急速な発展があった年でした。 DeepMind の科学者 ...

...

...

SelfOcc: 純粋な視覚に基づく初の自己教師あり 3D 占有予測 (清華大学)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

低品質の AIGC コンテンツがインターネット エコシステムに溢れかえれば、エコシステムは破壊されてしまいます。

少し前、ChatGPT は突然人気を博し、ユーザーベースが急速に増加しました。多くの人が「生成 AI...

...

ディープラーニングの一般化能力についての簡単な議論

1. DNNの一般化能力に関する問題この論文では主に、過剰パラメータ化されたニューラル ネットワー...