初めて精度が人間を超えました!アリババの機械読解力が世界記録を更新

初めて精度が人間を超えました!アリババの機械読解力が世界記録を更新

2018年の初めに、人工知能は大きな進歩を遂げました。 1月11日、スタンフォード大学が主催する世界有数の機械読解コンテスト「SQuAD」がランキングを更新した。業界を沸かせたのは、人工知能の読解力が史上初めて人間の読解力を上回ったことだ。 アリババは82.440の精度で世界記録を破り、人間のスコア82.304を上回った。

SQuADのディレクター、プラナフ・ラジプルカル氏は興奮を隠せなかった。彼はソーシャルメディアで、2018年は好調なスタートを切り、最初のモデル(Alibaba iDSTチームが提出したSLQA+)が精度マッチングにおいて人間のパフォーマンスを上回ったと述べました。次の課題: ファジー マッチング、人間はまだ 2.5 ポイントリードしています。

SQuAD コンペティションでは、大規模な機械読解データセット(100,000 の質問を含む)が構築され、記事は 500 件を超える Wikipedia の記事から取得されました。

データセット内の短い記事を読んだ後、人工知能は記事の内容に基づいていくつかの質問に答え、それらを標準的な回答と比較して、完全一致 (Exact Match) とあいまい一致 (F1 スコア) の結果を取得する必要があります。

SQuAD は、業界最高の機械読解コンテストとして認められており、Google、カーネギーメロン大学、スタンフォード大学、Microsoft Research Asia、アレン研究所、IBM、Facebook などの著名な企業研究機関や大学から熱心な参加を得ています。

この大きな技術的進歩は、アリババ研究チームが提案した「階層化融合注意メカニズム」に基づくディープニューラルネットワークモデルから生まれました。このモデルは、文章の内容と組み合わせて質問を見直す、質問を念頭に置いて記事を繰り返し読む、読んでいる間に忘れないように関連する注釈を付けるなど、読解問題を解く際の人間の行動の一部をシミュレートできます。

このモデルは、質問と記事内の特定の領域との関係を捉え、階層的な戦略を使用して徐々に注意を集中させ、回答の境界を明確にすることができます。一方、細部に注意を払いすぎないように、グローバル情報を融合方式で注意メカニズムに追加し、適切な修正を行って正しい焦点を確保します。

アリババのトップ自然言語処理科学者であるSi Luo氏は、機械はウィキ形式の客観的な知識の質問と回答を解決する上で非常に優れた結果を達成しており、一般的なコンテンツについて「理解し、考えることができる」という究極の目標に向かって進み続けると述べた。

今後、研究開発の焦点は、この技術を幅広い実用的なシナリオに実際に適用し、機械知能が私たちの生活に役立つようにすることになるでしょう。

実際、この技術はアリババ内で広く使用されています。例えば、毎年11月11日には、多くのお客様からイベントのルールについてお問い合わせをいただきます。 Ali Xiaomi チームは Si Luo チームの技術を使用して、機械がルールを直接読み取り、ユーザーにルール解釈サービスを提供できるようにしました。これは最も自然なインタラクション方法です。

たとえば、顧客は 1 つの製品について多くの基本的な質問をしますが、これらの質問に対する回答は実際には製品の詳細ページに記載されています。現在では、機械読解技術により、機械は商品詳細ページの商品説明文をよりインテリジェントに読み取って回答できるようになり、サービスコストを削減しながら購入コンバージョン率を向上させることができます。

Si Luo 氏が率いる自然言語処理チームは、Alibaba のエコシステム全体の技術的ニーズをサポートしています。同社が開発した自然言語技術プラットフォーム「AliNLP」は1日あたり1200億回以上呼び出されており、Alitranx翻訳システムは1日あたり7億回以上の呼び出しで20の言語でオンラインサービスを提供しています。

これまでに、2016 ACM CIKMパーソナライズ電子商取引検索、2017 IJCNLP中国語文法検出CGED評価、2017アメリカ規格・度量衡局TAC英語エンティティ分類コンテストで世界最高の成績を達成しています。

<<:  中国は人工知能(AI)で世界をリードしており、多くの技術が世界をリードしている。

>>:  覚えておいてください!私たちの未来に影響を与えるのはビッグデータや人工知能ではなくブロックチェーンです!

推薦する

...

アリババがコアテクノロジーを公開:推論性能が2位より5倍速く、4つの世界選手権で優勝した方法

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ディープ CNN アーキテクチャの革新の 7 つのカテゴリのレビュー

ディープ畳み込みニューラル ネットワーク (CNN) は、さまざまな競合ベンチマークで最先端の結果を...

東南大学が世界初のLK-99ゼロ耐性テストに成功しました!常温超伝導が再び出現、人類史は転換点に近づいている

室温超伝導を再現する実験は、完全に爆発的な成長期に突入しました!今朝午前1時過ぎ、東南大学の物理学教...

Metaの最新自社開発チップの結果が明らかに、7nmプロセス、RISC-V CPUを統合

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

GPT-4+Midjourney がコードなしで「Angry Pumpkin」を作成!実際の経験:閾値は低くなく、再現が難しい

市販の AI ツールを使えば、自分でコードを 1 行も書かずに完全な「Angry Birds」を作れ...

自動運転車の運転分類と必要な処理能力

今後 20 ~ 30 年で、自動運転車 (AV) は私たちの運転習慣や輸送業界を変え、社会全体に影響...

...

...

機械学習はビジネスシナリオにどのように適用されますか? 3つの実際のビジネスプロジェクト

国府如和の長年にわたる指導過程において、多くの学生が次のような質問をしました。機械学習は実際のビジネ...

ファーウェイの鄭葉来氏:イノベーションと包括性、テクノロジーが産業インテリジェンスの向上を促進

11月11日、中国ハイテクフェア2020が深センで開催されました。ファーウェイクラウドコンピューティ...

AIの発展が遺伝子工学を推進している

CRISPRは遺伝子編集技術の専門用語です。簡単に言えば、ウイルスは細菌に自身の遺伝子を組み込み、細...

プログラマーはどのようにして人工知能を学ぶのでしょうか? 2019 年の人工知能の給与見通しはどうでしょうか?

2019年の人工知能の給与水準、まずは全体の給与水準の2つの分析グラフを見てみましょう! ***は...

ジャック・マー:機械が人間に取って代わることは決してできない!それは何に代わるのでしょうか?

近年、人工知能、クラウドコンピューティング、ビッグデータ、モノのインターネット、産業用インターネット...