中国語からSQLへの自動変換精度92%、このKaggleマスターが世界記録を更新

中国語からSQLへの自動変換精度92%、このKaggleマスターが世界記録を更新

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

Zhuiyi Technologyが主催した第1回中国NL2SQLチャレンジで、国際レベルを超えた新たなNLP研究成果が生まれました。

NL2SQLタスクでは、コンテストで最高の結果が92.19%の精度に達し、英語NL2SQLデータセットWikiSQLの現在の完全一致精度86.0%を上回り、実行一致精度の点では91.8%という最高のパフォーマンスを達成しました。

この成果を達成したチームの名前は非常に野心的で、「90歳になるまで名前を変えない」と呼ばれています。チームメンバーには、国防科学技術大学の医師である張暁宇、修士課程の学生である蔡斌、Antech AIの王蘇紅が含まれます。彼らはこの大会で優勝し、賞金8万元を持ち帰りました。

[[279191]]

優勝チームは、CMU、北京大学、清華大学、上海交通大学、南京大学、USTCなど多くの大学や、中国移動、平安、捜狗などの企業から参加した1,457のチームの中で、92%を超える得点で抜きん出ました。この得点は、コンテスト審査員である復旦大学の肖陽華教授を驚かせ、「結果は完全に予想を上回りました」と述べました。

もう一人の審査員で、コンテスト主催者であるZhuiyi TechnologyのCTOであるLiu Yunfeng氏は、タスクの精度がコンテスト開始時の最高結果の60%以上から92.19%以上に向上し、当初の想像を超える改善だったと語った。

さらに、このコンテストで使用された中国語のデータセットはWikiSQLの英語のデータセットよりも難しいため、同じ設定で優勝チームのソリューションが中国語のタスクにおける外国機関の最高のアルゴリズム(最先端)を上回ったことが証明されました。

NL2SQL ベストプラクティスの公開

自然言語を機械が理解できる SQL 文に「翻訳」する NL2SQL は、人間とコンピュータのインタラクションにおいて大きな価値があります。このような結果は、92.19% のケースで、機械がユーザーの発言を正確に理解し、必要な回答を返すことができることを意味します。

そうですね、機械は人間の言語を理解できるので、複雑なデータベースから情報を見つけるのが簡単になります。

肖陽華教授は、ビッグデータの価値実現を阻む最大の問題は、データへのアクセスのハードルが高すぎるため、データベース管理者が複雑なSQLを記述しなければならないことだと述べた。また、中国語の表現はより多様であることを考慮すると、中国語のNL2SQLは英語よりもはるかに難しい。

[[279192]]

肖 陽華教授

したがって、中国語の人間言語からSQLなどのコンピューター言語への変換の問題が解決されると、あなたとコミュニケーションをとるAIシステムは「よりスマート」になり、あなたの質問を理解して答えを見つけることが容易になります。アプリ内のスマートカスタマーサービスや自宅のスマートスピーカーがあなたの質問の答えを知らないケースも少なくなります。

中国の NL2SQL の問題に関しては、優勝チームの Zhang Xiaoyu が競技会の防衛で実装方法を明らかにしました。

[[279193]]

優勝チームキャプテン 張暁宇

WikiSQLランキングで1位にランクされ、Microsoft Dynamics 365チームから生まれたX-SQLには、いくつかの問題があります。モデルフレームワークが完全に適応されておらず、列の機能は値の抽出に重要ではなく、抽出の混乱が生じやすいです。

これらの問題に対処するため、チャンピオンチームは、 X -SQLの元々の6つのサブタスクを8つのサブタスクに変更し、S-num、値抽出、値マッチングの3つのサブモデルを追加したM-SQLを提案しました。これは、クエリに含まれるすべての値を一度に抽出し、値とデータベーステーブルフィールドの関係を判断します。

その後、細かい改善を行いました。たとえば、データの前処理では、データ、年、単位、日付、同義語を変更してクエリパラダイムを統一しました。クエリ情報表現では、CLS タグを XLS タグに置き換え、オフライン検証セットの精度を 0.3 パーセントポイント向上させました。

使用される事前トレーニング済みモデルは、ハルビン工科大学がリリースしたBERT-wwm-extモデルです。

張暁宇さんは最終結果に非常に満足し、「機械の性能は私より優れていると思います。人間のレベルを超えたと恥ずかしげもなく言えます。」と語った。

チャンピオンシップチーム

「90歳まで名前を変えるな」チームのキャプテンである張暁宇さんは、国防を学ぶ学生であり、NLPの分野に重点を置く競技愛好家です。彼は、2018 年の Rice Cup Military Reading Comprehension Challenge で 2 位を獲得し、2019 年の Kaggle PetFinder コンテストで金メダルを獲得し、現在は Kaggle Master のリストに載っています。

チームのもう 1 人のメンバーである Sai Bin は、国立国防科学技術大学の同級生であり、Wang Suhong は Kaggle コミュニティで出会ったチームメイトで、現在 Kaggle リーダーボードの上位 1,000 人のユーザーの 1 人です。

このチームは優勝しましたが、他のチームよりも遅く準備を始めました。彼らが準備を始めたとき、他のチームはすでに2週間前から準備をしていました。

あと1ヶ月しかありません。 1か月の準備期間中、3人は毎日オンラインで協力して計画を話し合い、平均して1日5〜6時間働いていた。

彼らは1位という結果に驚きませんでした。結局のところ、このツールはすでにリストの 1 位にランクされており、このタスクにおける精度も業界トップクラスであるため、1 位にランクされるに値します。

最後に、コンテストでの経験について、Zhang Xiaoyu 氏は「もっとコードを書き、もっと論文を読む」と非常にシンプルにまとめました。

技術的な「ハンマー」がシーンの「釘」を見つけるのを手伝ってください

Zhuiyi Technology は深センに本社を置き、北京、上海、南京、香港、シンガポール、ベラルーシにも研究開発チームまたは支店を持っています。

Zhuiyiは設立から3年間で、China Merchants Capital、Sinovation Ventures、Morningside Venture Capital、Banyan Capital、GGV Capitalから4回の投資ラウンドを完了し、総資金調達額は7,000万米ドルに達しました。China Merchants Bank Credit Card、China Mobile、China Southern Power Grid、PICC、TencentはすべてZhuiyiの顧客です。

資金調達規模から判断すると、このテンセント系のAI企業は国内のNLP分野のリーダーになったと言える。

テクノロジー面では、Zhuiyi はさまざまな NLP タスクで画期的な進歩を遂げ、CoQA や CMRC2018 中国語機械読解などのコンテストで優勝しました。

NL2SQLタスクについて、かつてテンセントでT4レベルに到達した劉雲鋒氏は、このコンテストの前は中国のNL2SQL企業はZhuiyiとマイクロソフトの2社しかなかったが、今回のコンテストを通じて、みんなが火を燃やすことができれば、この技術は推進できると語った。

「お客様は釘を持っていても、それを打つためのハンマーの種類を知りません。一方、私たちAI企業はハンマーを持っていても、釘がどこにあるのかを知りません。このコンペティションを通じて、釘とハンマーをマッチングさせ、技術を実装するためのシナリオを見つけることができます。」

NLPからコンピュータービジョンへ

このコンテストはNLP分野のコンテストであるにもかかわらず、コンピュータービジョン分野の研究者が多数参加したことは注目に値します。決勝に進出したチーム「Take Me Fly, Boss」のメンバー2人は、CVの大学院生です。

[[279194]]

Zhuiyi Technology CTO 劉雲鋒氏

Zhuiyi TechnologyのCTOである劉雲鋒氏は、産業実装に関しては、マルチモーダル融合の傾向が強まり、ビジョンとNLPがますます組み合わされるようになると考えています。複数の信号の同時処理が必要であり、人間とコンピューターの相互作用にはNLP技術だけでなくビジョン技術も必要です。NLP企業であるZhuiyi Technology自体も、ビジョンと音声の技術チームを持っています。

「AI企業は主にエンタープライズサービスを提供します。企業は1つの方向(テクノロジー)だけに焦点を当てることはありません。企業がNLPとビジョンの両方を必要とする場合、2つのテクノロジーを単独で統合することはできないため、2つの企業を探すことはありません。」

そのため、劉雲鋒氏は、将来AIをリードする企業はフルスタックAI企業でなければならないと考えています。そうした企業は最先端の技術を持ちながらも、1つの分野の技術だけに焦点を当てるわけではないのです。

最後に、このコンテストのデータセットは後日公開される予定です。おそらく、これが NLP 分野における次の激戦の場となるでしょう。

Zhuiyi Technologyが主催した第1回中国NL2SQLチャレンジで、国際レベルを超えた新たなNLP研究成果が生まれました。

NL2SQLタスクでは、コンテストで最高の結果が92.19%の精度に達し、英語NL2SQLデータセットWikiSQLの現在の完全一致精度86.0%を上回り、実行一致精度の点では91.8%という最高のパフォーマンスを達成しました。

<<:  CV モデルが動作しないのはなぜですか?理由がこんなに単純だとは思いませんでした...

>>:  人工知能のトレンドに遅れないようにするには、Python と C/C++ のどちらを学ぶべきでしょうか?答えはここにあります

ブログ    
ブログ    
ブログ    

推薦する

ビッグデータに責任を負わせないでください。スモールデータをうまく活用する方が効果的かもしれません。

誰もがビッグ データについて語っていますが、大規模なデータ セットを処理するにはより多くのストレージ...

モザイクも安全ではないのですか? 「ブロックバスター」のモザイクはAIによってワンクリックで削除可能

知っていましたか?モザイクはもう安全ではありません!こんにちは、友人の皆さん。私は Jiguo.co...

ChatGPT と ReactJS を統合してよりスマートな会話型インターフェースを実現

翻訳者 |李睿レビュー | Chonglouテクノロジーの世界が進化し続けるにつれて、チャットボット...

HTML5アウトラインアルゴリズムが構造に与える影響

[[91338]] HTML5 がリリースされてから長い時間が経ちますが、日々の仕事や個人の Web...

...

...

初心者のためのホームオートメーション完全ガイド

スマートホームはテクノロジーを活用して、居住者にさらなる利便性、節約、快適性、セキュリティを提供しま...

...

GPT4 はロボットにペンをスムーズに回転させる方法を教えます。

チャット中に数学者テレンス・タオ氏にインスピレーションを与えたGPT-4は、最近、ロボットにペンを回...

人工知能とモノのインターネット (AIoT) を組み合わせた場合の威力とは?

モノのインターネット (IoT) や人工知能 (AI) について聞いたことがあると思います。しかし、...

...

XNOR-NETテクノロジー詳細解説:AIテクノロジーがモバイル端末に搭載され、新時代が到来

[[187849]]この時代、人間の生活はスマートデバイスから切り離すことはできません。持ち歩く携帯...

史上最大規模のAIによる疫病対策キャンペーン

普段は人工知能技術にあまり興味がない人でも、この特別な期間中はAIという文字の組み合わせに注目するで...

楽観主義と悲観主義の議論は無意味。AIに必要なのは開発モデルについて考えることだ

最近、烏鎮での夕食会で大物たちが何を食べたかという噂に加え、インターネット会議では人工知能に関する一...