2019年自然言語処理フロンティアフォーラム: 機械による「読む、書く、話す、翻訳する」に焦点を当て、自然言語処理の未来を探る

2019年自然言語処理フロンティアフォーラム: 機械による「読む、書く、話す、翻訳する」に焦点を当て、自然言語処理の未来を探る

人工知能の本質は、機械が人間のように世界を認識し理解できるようにすることです。言語と知識を研究する自然言語処理(NLP)技術は、人工知能の中核課題の 1 つです。 5月26日、百度、中国コンピュータ学会中国情報技術委員会、中国中国情報処理学会青年委員会が共同で「2019年自然言語処理フロンティアフォーラム」を開催した。

フォーラムでは、Baidu の上級副社長兼 ACL フェローである王海鋒博士が開会の挨拶を行いました。同氏は「言語は人間の思考とコミュニケーションの担い手であり、また人間の知識の凝縮と継承の担い手でもある。自然言語処理技術は、アルゴリズム、コンピューティングパワー、データを必要とするだけでなく、知識の継続的な凝縮も必要とする。言語処理を我々の世界の理解と変革のプロセスと組み合わせる必要があるため、革新と突破口がまだたくさんある」と述べた。同氏は、このフォーラムを通じて、若い学者たちが交流を強化し、新たな火花を散らし、自然言語処理の発展と産業化を共同で推進し、人工知能時代の我々の生活がより良くなることを期待している。

[[266622]]

このフォーラムのテーマは「機械の『読む、書く、話す、翻訳する』 - NLP の未来を探る」であり、セマンティック コンピューティング、自動質疑応答、言語生成、人間とコンピュータの対話、機械翻訳に関する 5 つの特別レポートと、上記のトピックに関するゲスト ダイアログ セッションが含まれます。このフォーラムでは、産学の若手専門家や学者が集まり、NLP 分野における最新の技術進歩、産業応用、開発動向について議論し、産学研究の深い統合を促進し、自然言語処理技術の進歩を促進することを目指します。

「セマンティック コンピューティング」では、コンピューターを使用して自然言語の意味を表現、分析、計算し、機械が意味を理解する能力を持つようにする方法を研究します。ハルビン工業大学の車万祥教授は、文脈に応じて多義性現象をより適切に処理し、複数の自然言語処理タスクの精度を大幅に向上できる動的単語埋め込みの技術的進歩を紹介しました。復旦大学の邱希鵬准教授は、表現学習の最新の進歩を紹介し、現在の主流モデルの基本原理と長所と短所を分析・比較し、ローカルと非ローカルの意味関係をより適切に統合する方法、事前知識をより適切に組み込む方法、現在の複雑なネットワークモデルを簡素化および高速化する方法について検討しました。北京大学の研究者孫旭氏はスパースディープラーニングに関する研究を行い、ニューラルネットワークを簡素化するシンプルで効果的なアルゴリズムを提案した。このアルゴリズムは、完全な勾配のサブセットのみを使用してモデルパラメータを更新し、トレーニングとデコードの複雑さを大幅に軽減する。 Baidu のチーフアーキテクト Sun Yu 氏は、Baidu が最近提案した知識強化型セマンティック表現モデル ERNIE を紹介しました。これはエンティティやフレーズなどの知識に基づいてモデル化されており、言語推論や意味の類似性など、複数のタスクで大幅な改善を実現しています。

「自動質問と回答」のトピックでは、機械がテキストを読み取って、その内容に関連する質問に答えられるようにする、機械の「読み取り」能力について探ります。機械読解は、機械がテキストデータから知識を獲得して適用することを可能にし、質問応答分野における重要な技術の 1 つです。中国科学院自動化研究所の准研究員であるLiu Kang氏は、テキスト読解の基本的な枠組みと方法を紹介した。彼は、読解課題にとって適切なデータセットを構築することは非常に重要であり、知識をより良く統合する方法が将来の重要な研究方向であると述べた。 Baidu のシニア R&D エンジニアである Liu Jing 氏は、テキスト表現と知識表現を深く統合したモデルである KT-NET と、Baidu がリリースした実用向け中国語読解データセットである DuReader 2.0 を紹介しました。このデータセットに基づき、百度、中国コンピューター学会、中国情報処理学会は、中国語の読解技術の進歩を共同で推進するため、2年連続で機械読解評価を実施しました。

「言語生成」のトピックでは、コンピューターが人間のように自然言語を使用して表現および作成できるようにする方法に焦点を当てています。北京大学の万暁軍教授は、自然言語生成(NLG)技術と応用の最新の進歩を紹介し、自然言語生成が現在2つの大きな課題に直面していると指摘した。1つ目は、生成されたテキストの品質評価であり、2つ目は並列データの不足である。これらの問題が解決されれば、自然言語生成の発展が大きく促進されるでしょう。彼はまた、特に知識の総合的な活用において、現在のテキスト生成は人間との間にまだ大きなギャップがあると述べた。 Baiduのチーフアーキテクトである肖欣燕氏は、言語生成技術におけるBaiduのイノベーションと応用を紹介し、計画、情報選択、エンドツーエンドなどに基づくさまざまなモデルを提案し、記事生成、要約生成、詩生成などのタスクで良好な結果を達成しました。さらに、百度はインテリジェントライティングプラットフォームも立ち上げました。これは、自動ライティングとアシストライティング機能を提供することでコンテンツ作成の効率と品質を向上させ、インテリジェント作成の分野でより多くの可能性を提供します。

「人間とコンピュータの対話」のトピックでは、コンピュータと人間が相互に通信できるようにする方法を探ります。清華大学の黄敏烈准教授は、人間とコンピュータの対話の発展について論じた。ほとんどの従来の対話システムは強力なセマンティック手法を採用していたが、現代のニューラル ネットワーク手法はデータ駆動型および確率統計に基づく弱いセマンティック手法を開発している。意味理解は、人間とコンピュータの対話において常に克服しなければならない難しい問題です。データと知識をより適切に組み合わせる方法こそ、この分野が協力して取り組むべき方向性です。 BaiduのチーフR&Dアーキテクトである孫科氏は、Baiduが新たにリリースしたインテリジェント対話システムトレーニングおよびサービスプラットフォームUNIT 3.0を紹介しました。スキルの構築、知識の構築、スキルと知識の統合に焦点を当て、複数のコアテクノロジーとツールをリリースし、対話システムのカスタマイズコストを大幅に削減しました。

「機械翻訳」とは、コンピュータを利用して異なる言語間の変換や生成を行うことを指します。自然言語処理の分野において、言語のギャップを埋めるための重要な技術です。清華大学の劉洋准教授は、まずニューラルネットワーク機械翻訳の基本原理を紹介し、この方法は大きく進歩したものの、依然として多くの課題に直面していると指摘した。 Liu Yang 氏は、知識駆動型で解釈可能、かつ堅牢なニューラル ネットワーク機械翻訳の最新の進歩について紹介しました。百度の人工知能技術委員会委員長の何忠軍氏は、機械同時通訳の主な課題と最新の進歩を紹介し、機械同時通訳は現在、技術、データ、評価の3つの面で課題に直面していると指摘した。百度の研究成果と合わせて、***が開発した百度翻訳AI同時通訳が現場で活用されました。会場の聴衆は携帯電話で会議の QR コードをスキャンして、リアルタイムで翻訳を聞くことができます。

5つの主要トピックについての議論の後、Che Wanxiang、Qiu Xipeng、Huang Minlie、Liu Yang、およびBaiduのシニアサイエンティストLv YajuanとBaidu PaddlePaddleのチーフアーキテクトYu Dianhaiが「NLPの将来の道」についてハイエンドな対話を行いました。 「過去 5 年間の NLP の画期的な進歩」、「NLP の開発傾向と今後 5 ~ 10 年間の画期的な方向性」などのトピックについて素晴らしい共有が行われました。彼らは、過去 5 年間で NLP がデータ、モデル、アルゴリズムなどの多くの面で画期的な進歩を遂げたと考えています。中国の学術分野におけるNLP研究と産業応用は国際的に最先端を走っており、近年、この分野のトップクラスの国際会議に提出される論文の数は飛躍的に増加しており、論文の質も向上しています。同時に、前向きで独創的な取り組みをさらに強化する必要もあります。中国のNLPの発展の潜在力を過小評価することはできません。今後の開発動向について話す際、ゲストは、知識のさらなる統合、マルチモーダル性、より人間に近い学習メカニズムの探求が、NLP 分野のさらなる改善をもたらすだろうと述べました。

[[266623]]

自然言語処理は人工知能の最高峰として称賛されています。自然言語処理機能が進化し続けるにつれて、人工知能も絶えず向上しています。自然言語処理技術は、インテリジェント検索、ディープラーニングによる質疑応答、対話システム、インテリジェントライティング、機械翻訳などの分野で広く利用されており、ユーザーにさらにスマートな体験を提供し、情報やサービスに対するニーズを満たしています。同時に、金融、サービス、小売、製造などの業界でもますます利用され、業界のインテリジェントな発展を促進しています。 NLP の今後の方向性は何でしょうか? おそらく標準的な答えはありません。しかし、私たちは常にテクノロジーの力を信じてきました。将来の可能性を探ると、王海鋒氏は、テクノロジーの発展に伴い、人々は自然言語をより深く理解し、知識を習得し、人工知能がより大きな価値を発揮し、人類社会の発展にさらに大きなサポートを提供することになると述べた。

<<:  早く見て!無料の機械学習コーストップ10

>>:  第 3 回 AIAED グローバル AI+ アダプティブ教育サミットが成功裏に開催され、最も包括的なハイライトがここにあります。

ブログ    
ブログ    

推薦する

外国メディアが報じたところによると、EUはデータプライバシーを弱めるため、エンドツーエンドの暗号化にバックドアを検討している。

インド、米国、英国、オーストラリアに続き、エンドツーエンドの暗号化は欧州連合から厳しい監視を受けてい...

Google、イスラエルの交差点にAI信号機を設置

2021年最後の法定休日に別れを告げ、皆が仕事に戻り、仕事帰りの通勤のリズムが戻りました。北京、上海...

...

製造業におけるコンピューター ビジョン: 機会と導入のヒント

時計職人の片眼鏡から、絵を描くのに便利な「ルシーダカメラ」まで、職人たちは光学技術を使って感覚を高め...

顔認識は簡単に破られるのでしょうか?虐待と闘う方法

未来産業研究所は、顔認識市場規模は今後5年間で平均23%の複合成長率を維持し、2024年までに市場規...

...

...

...

チップ設計の極めて高いハードルがAIによって「打ち破られる」

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

相関関係は因果関係ではない。ディープラーニングによりAIは「10万のなぜ」を問うことができる

[[274938]]ビッグデータダイジェスト制作出典: searchenterpriseai編纂者:...

Sogouの技術者が在宅勤務中にサーバーを誤操作し、誤って「マグニチュード12の地震警報」を発令した。

2月3日午前11時頃、捜狗入力法の一部のユーザーは、河北省興隆市でマグニチュード12の地震が発生し...

エッジ vs. クラウド: どちらの AI インフラストラクチャを選択すべきか?

エッジコンピューティングは最近ホットな話題です。近年最もエキサイティングな技術革新として称賛され、そ...

人工知能が誤って解釈する画像とはどのようなものでしょうか?

ウィリアム・ギブソンの2010年の小説『ゼロ・ヒストリー』では、ある登場人物が「これまでで最も醜いT...

最後にもう一度、一貫性のあるハッシュについて長々と話します。

一貫性のあるハッシュについて見てきましたが、一貫性のないハッシュもあるはずです。私たちが普段話題にし...