アリババが自然言語理解の世界記録を更新、AIの常識的推論は人間のそれに近づいている

アリババが自然言語理解の世界記録を更新、AIの常識的推論は人間のそれに近づいている

最近、アリババAIは常識QA分野の権威あるデータセットであるCommonsenseQAで新たな世界記録を樹立し、AIの常識推論能力を大幅に向上させました。この技術は、DAMO アカデミーの科学者の指導の下、95 年以降のインターンシップ生である Ye Zhixiu 氏によるインターンシップの成果です。

CommonsenseQA は常識的な知識に基づいた質問応答を研究するために提案されたデータセットです。これまでの SWAG や SQuAD データセットよりも難易度が高いです。現在普及している言語モデル BERT は、SWAG や SQuAD では人間に近いかそれ以上のパフォーマンスを達成していますが、CommonsenseQA での精度は依然として人間よりもはるかに低いです。


上の画像は、CommonsenseQA データセットの常識に関する質問を示しています。親指が上向きになっている選択肢が正解です。

自然言語理解 (NLP) は人工知能の最高峰であり、常識的推論は最も難しい NLP タスクの 1 つです。機械翻訳や読解などのNLPタスクでは、AIのパフォーマンスは人間のレベルに近づいたり、それを上回ったりしています。Alibaba AIは、WMT、機械読解コンテストSQuAD、テキスト読解チャレンジMS MARCOなどの国際的な高度な機械翻訳コンテストで優勝し、人間の記録さえも上回っています。

対照的に、AIの常識的な推論能力は人間のそれよりもはるかに劣っています。常識とは、塩は塩辛い、雨が降ったら傘を使う必要がある、村は湖ではなく陸地にあるなど、ほとんどの人が理解し受け入れている客観的な事実を指します。人々が質問に答えるとき、この自明な背景知識を組み込むことがよくあります。しかし、機械には常識がないので、「路上で人々が傘をさしている」という元の文を、「外は雨が降っている」という論理的仮定に自動的に関連付けることはできません。

ディープラーニングの先駆者の一人でチューリング賞受賞者のヤン・ルカン氏は、非常に賢い AI であっても常識においては猫ほど優れていないと主張したことがあります。 12,000件以上の常識的な質問を含むCommonsenseQAデータセットでは、人気のAIモデルBERTの回答精度は56.7%で、人間の89%をはるかに下回っています。

Alibaba DAMO Academy Speech Laboratory は AMS メソッドを提案し、BERT モデルの常識推論能力を大幅に向上させました。 AMS メソッドは BERT と同じモデルを使用し、BERT のみを事前トレーニングします。モデルの計算の複雑さを増やすことなく、CommonsenseQA データセットの精度が 5.5% から 62.2% 向上します。


上図はCommonsenseQAデータセットのスコアリストです。Alibaba AIが新たな世界記録を樹立しました。

アリババの技術革新は、次世代のヒューマン・コンピュータ・インタラクション製品の常識理解能力を大幅に向上させ、音声ナビゲーション、スマートテレビ、音声発券機などの製品に適用できる。

次のようなシナリオを想像してください。最近移転した遠隔地の村を探して運転していますが、ナビゲーションはまだその村の位置情報を更新していません。村がある土地は人工湖に掘削されており、AIには常識がないので、ナビは湖の中心まで直接連れて行ってくれます。 AI に常識があれば、このような「愚かな」間違いは起こさないでしょう。

DAMOアカデミーは、将来的にモデルと論文をオープンソース化し、新たな研究結果を業界と共有すると述べた。

<<:  ガートナーの調査によると、企業は来年AIプロジェクトを2倍に増やすと予想している。

>>:  エッジコンピューティング時代の到来は AI にどのような影響を与えるのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

AIは実際にチップを生成できます! GPT-4はわずか19回の対話で130nmチップを構築し、チップ設計業界におけるHDLの大きな課題を克服しました。

GPT-4 はすでに人間がチップを作るのに役立っています!ニューヨーク大学タンドン工学部の研究者た...

...

ベクトルデータベースは AI をどのように改善するのでしょうか?

翻訳者 |ブガッティレビュー | Chonglou事前トレーニング済みのAIモデルがすぐに利用できる...

人工知能を通じて「自分を知る」

2016年、AlphaGoが人間のチェスプレイヤーであるイ・セドルを破り、人工知能に関する研究と考...

産業用AIが製造業に革命を起こす5つの方法

人工知能 (AI) は、製造業において総合設備効率 (OEE) と生産時の初回歩留まりを向上させるた...

専門家の議論:AIの冬は本当に来るのか?

数日前、コンピュータービジョンとAIの専門家であるフィリップ・ピエニエフスキー氏は自身のブログに「A...

英国メディア:シリコンバレーの一部の人々はAIに熱心すぎて「学習は無意味だ」と言っている

6月13日のニュース、人工知能の急速な発展に伴い、シリコンバレーは、人間の行動は予測可能であり、スキ...

AI、機械学習、ディープラーニングの違いは何ですか?

人工知能 (AI) は未来だと言う人もいれば、AI は SF だと言う人もいれば、AI は私たちの日...

...

GPT-4.5がリーク、3Dビデオをサポート、価格は6倍に上昇?ウルトラマンが自ら反応

GPT 4.5 に重大なリークの疑い: 1 つは、新しいモデルには新しいマルチモーダル機能が搭載され...

NLP 70 年!スタンフォード大学のマニング教授が長文の記事を執筆:「基本モデルは10年でAGIになることができるか?」

過去 10 年間で、自然言語処理の分野は、単純なニューラル ネットワーク計算と大規模なトレーニング ...

「ロボット革命」は人類社会の発展にどのような影響を与えるのでしょうか?

世界経済フォーラムが最近発表した報告書によると、2025年までに世界の仕事の半分はロボットによって行...

5Gネットワ​​ーク構築80%:5Gロボットが新たな転換点を迎えようとしている

最近、CCTVニュースによると、中国は2月末までに計画通り5Gネットワ​​ーク構築の80%を完了した...

アニメーション + 原理 + コード、トップ 10 の古典的なソート アルゴリズムを解釈する

ソートアルゴリズムは、「データ構造とアルゴリズム」における最も基本的なアルゴリズムの 1 つです。ソ...