2020 年の AI と機械学習の重要なトレンドは何ですか?

競争が激化するテクノロジー市場において、ハイテク新興企業から世界的な多国籍企業まで、誰もが人工知能を重要な競争上の優位性として捉えています。

[[319533]]

しかし、AI 業界は急速に進化しているため、最新の研究の進歩や成果を追跡したり、科学的発見をビジネス成果に応用したりすることさえ困難になる場合があります。

この記事では、企業が 2020 年に強力な AI 戦略を策定できるように、自然言語処理、会話型 AI、コンピュータービジョン、強化学習など、さまざまな研究分野の最新動向をまとめています。

自然言語処理

2018 年、事前トレーニング済みの言語モデルにより、自然言語の理解と生成の限界が押し上げられました。これらは、昨年の自然言語処理の進歩においても大きな役割を果たしました。

NLP 開発を初めて行う場合、事前トレーニング済みの言語モデルを使用すると、NLP モデルを大規模なデータセットで事前トレーニングし、他の NLP タスクに合わせてすばやく微調整できるため、NLP の実際のアプリケーションがはるかに高速、簡単、便利になります。

主要な研究機関とテクノロジー企業のチームが、最先端の言語モデルをさらに洗練させる方法を模索しました。これらの改善の多くはコンピューティング能力の大幅な向上によってもたらされましたが、多くの研究グループもモデルを軽量化し、高いパフォーマンスを維持するためのより洗練された方法を発見しました。

現在の研究動向は次のとおりです。

新しい NLP パラダイムは「事前トレーニング + 微調整」です。過去 2 年間、転移学習が NLP 研究の主流となってきました。 ULMFiT、CoVe、ELMo、OpenAI GPT、BERT、OpenAI GPT-2、XLNet、RoBERTa、ALBERT – これは最近導入された重要な事前トレーニング済み言語モデルの完全なリストです。転移学習は間違いなく NLP を新たな高みに押し上げましたが、大きな計算コストと大規模な注釈付きデータセットを必要とすると批判されることがよくあります。
言語学と知識によって、NLP モデルのパフォーマンスが向上する可能性があります。専門家は、言語学がデータ駆動型手法の解釈可能性を向上させることでディープラーニングに貢献できると考えています。コンテキストと人間の知識を活用することで、NLP システムのパフォーマンスをさらに向上させることができます。
ニューラル機械翻訳は目に見える進歩を見せています。同時機械翻訳は、すでに実際のアプリケーションで利用可能です。最近の研究では、ニューラルネットワークアーキテクチャを最適化し、視覚コンテキストを活用し、教師なしおよび半教師あり機械翻訳の新しい方法を導入することで、翻訳の品質をさらに向上させることを目指しています。

会話型AI

会話型 AI は、業界を問わずビジネス慣行の不可欠な部分となっています。チャットボットが顧客サービス、販売、マーケティングにもたらすメリットを活用する企業が増えています。

チャットボットは大手企業にとって「必須」の資産となっているものの、そのパフォーマンスは依然として人間のパフォーマンスには遠く及びません。主要な研究機関の研究者やテクノロジーリーダーは、会話システムのパフォーマンスを向上させる方法を研究してきました。

対話システムは、時間の経過とともに対話の追跡を改善しています。昨年発表された多くの研究論文は、会話の履歴と文脈をより有効に活用することで、会話中に生じた複雑な関係を理解するシステムの能力を向上させることを目指していました。
多くの研究チームが、機械が生成した応答の多様性に取り組んでいます。現在、現実世界のチャットボットは退屈で反復的な応答を返すことがよくあります。昨年は、多様でありながら関連性のある反応を生み出すことを目指して、いくつかの優れた研究論文が発表されました。
感情認識は、オープンドメインチャットボットにとって重要な機能と見なされています。そのため、研究者たちは会話システムに共感を組み込む良い方法を研究しています。この研究分野での成果はまだ小さいですが、感情認識の大きな進歩により、ソーシャルロボットのパフォーマンスと人気が大幅に向上し、心理療法におけるチャットボットの使用も増加する可能性があります。

コンピュータビジョン

過去数年間にわたり、コンピュータービジョン (CV) システムは、医療、セキュリティ、輸送、小売、銀行、農業などの分野でのアプリケーションの成功を通じて、業界全体とビジネス機能に革命をもたらしました。

EfficientNet や SinGAN などの最近導入されたアーキテクチャと方法により、視覚システムの認識および生成機能がさらに向上しました。

コンピュータービジョンにおける一般的な研究トピックは次のとおりです。

3D は現在、CV における主要な研究分野の 1 つです。今年は、2D 投影から 3D 世界を再構築することを目的とした興味深い研究論文がいくつか発表されました。 Google の研究チームは、自然シーン全体の深度マップを生成するために斬新なアプローチを採用しました。 Facebook AI チームは、ポイントクラウドでの 3D オブジェクト検出に関する興味深いソリューションを提案しました。
教師なし学習法の人気が高まっています。たとえば、スタンフォード大学の研究チームは、教師なし学習による物体検出と認識のための有望なローカル集約手法を導入しました。 ICCV 2019 優秀論文賞にノミネートされたもう 1 つの優れた論文では、教師なし学習を使用して 3D 形状間の対応を計算しています。
コンピュータービジョンの研究は NLP とうまく組み合わせられています。最近の研究の進歩により、自然言語で 2 つの画像間の変化を堅牢にキャプション付けしたり、3D 環境での視覚言語ナビゲーションが可能になったほか、階層的な視覚言語表現を学習して画像のキャプションや視覚的根拠をより適切に検索できるようになりました。

強化学習

強化学習 (RL) は、ビジネスアプリケーションにおいては、教師あり学習や教師なし学習よりもまだ価値が低いです。これは、ロボット工学やゲームなど、大量のシミュレーションデータを生成できる分野でのみ、成功裏に適用されてきました。

しかし、多くの専門家は、RL が人工汎用知能 (AGI)、つまり真の知能への有望な道であると考えています。そのため、優れた研究機関や技術リーダーの研究チームは、RL アルゴリズムをより効率的かつ安定したものにする方法を模索しています。強化学習における一般的な研究テーマには以下のものがあります。

マルチエージェント強化学習 (MARL) は急速に発展しています。 OpenAI チームは最近、シミュレートされたかくれんぼ環境内のエージェントが、研究者が環境がサポートしていることに気付いていなかった戦略を構築する方法を示しました。複数のエージェントが対応する動機を持っている場合に、どのように相互に影響し合うかを調査したもう 1 つの優れた論文が、ICML 2019 で佳作に選ばれました。
オフポリシー評価とオフポリシー学習は、将来の RL アプリケーションにとって非常に重要です。この研究分野における最近のブレークスルーには、複数の制約下でのポリシー学習の処理、パラメトリックモデルと非パラメトリックモデルの組み合わせ、エージェントをポリシーに近い方法で動作させる新しいクラスのオフポリシーアルゴリズムの導入など、新しいソリューションが含まれています。
探査は大きな進歩が見込める分野です。 ICML 2019 で発表された論文では、強化学習におけるブリッジ効果に対処するために、分布強化学習、最大エントロピー探索、安全条件を使用した新しい効率的な探索手法を紹介しています。

ここでは、NLP、会話型 AI、コンピュータービジョン、強化学習などの人気のサブトピックにおける新しい AI および機械学習の研究動向の概要を示します。これらの多くはビジネスに影響を及ぼします。

2019 年に機械学習で達成された目覚ましい技術的進歩を基に、2020 年には応用 AI のさらなる進歩が期待されます。

<<: 企業はデータセンターで人工知能を広く利用する準備ができているでしょうか?

>>: このBステーションアップマスターはハードコアすぎる！手作りAIテレビ：ハードウェアを自分ではんだ付けし、自分でコードを書く