中国の研究チームが86%の精度を誇るAI「皮肉」検出モデルを発表

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

最近は、インターネットなどでもベルサイユ文学的な雰囲気が強く出ています。

[[353374]]

本当にイライラします。寝過ごしてモルディブ行きの飛行機に乗り遅れたので、プライベートジェットで行かなければなりません。

一見平易な言葉の中に、派手な見せびらかしの感覚がある。これがベルサイユ文学である。

[[353375]]

毎年「ベルサイユ文学」などのネット流行語が生まれますが、その意味を本当に理解していますか？

まずはちょっとしたテストをしてみましょう！

次の3つの文章のうち、どれが風刺文、苦情文、ベルサイユ文学であるか判断してください。

この社会では、どんなに批判に耐えなければならないとしても、耐える必要はありません。なぜなら、今では偽善はもはや偽善とは呼ばれず、高い感情的知性と呼ばれるからです。
君にとって醜いことは本当に難しい。朝は人々を怖がらせるために、夜は幽霊を怖がらせるために外へ飛び出すんだ。
iPhone 11 Pro Max は本当に使いにくいです。私のは動かなくなってしまいました。512g のダークグリーンのものです。実際、それです。1024g を購入する必要があります。

答えが正しかったとしても、自慢しないでください。AI でもこの質問に答えられる可能性があるからです。

最近、北京の情報工学研究所と中国科学院は共同で、皮肉を識別する精度が86%のAIモデルを立ち上げた。

なお、この研究成果は計算言語学協会（ACL）に掲載されました。

これを聞いて、なぜ AI が「皮肉」を認識する必要があるのかと疑問に思うかもしれません。 ? ?

AI「皮肉」モデル

実際、感情を表現する方法としての皮肉は、AI 感情分析の重要な研究方向です。

感情分析は、傾向分析または意見マイニングとも呼ばれ、感情的な意味合いを持つ主観的なテキストを分析、処理、要約、および推論するプロセスです。感情分析機能を利用することで、主観的な説明を含む自然言語テキストの肯定的または否定的な感情傾向を自動的に判断し、対応する結果を提供することができます。

それは何の役に立つのでしょうか?簡単な例を挙げてみましょう。

今回の米国選挙で、バイデン氏とトランプ氏の2つの関係者以外で最も頭を悩ませているのは、フェイスブックの創設者マーク・ザッカーバーグ氏かもしれない。

[[353376]]

常に「言論の自由」で知られているフェイスブックは、米大統領選の期間中、ソーシャルネットワーク上に「虚偽の政治的発言」が掲載されないようにしなければならない。

巨大なソーシャルネットワークでは毎日何千もの投稿が公開されています。政治的リスクのある投稿とそうでない投稿を判断するために、投稿を 1 つ 1 つ手動で確認して削除するのは明らかに非現実的です。

ここで AI が役に立ちます。

米大統領選のずっと前から、FacebookのAI研究チームはAI言語モデルを使い、インターネット上の虚偽情報やヘイトスピーチを特定し始めていた。統計によると、2020年第1四半期にFacebookはXLM言語モデルを使ってヘイトスピーチを含む960万件の投稿を削除した。

この点に関して、フェイスブックの最高技術責任者マイク・シュローファー氏も次のように述べた。

私は、AI が日常の問題を解決できると考えるほど世間知らずではありませんが、AI はいくつかの一般的なタスクだけでなく、人間には到底できない数十億規模の面倒なタスクにも確実に役立つと考えています。

この例では、AI の難しさは、感情分析機能を向上させ、虚偽の政治的発言を含む投稿を正確に識別する方法にあります。

しかし比較すると、皮肉を識別することは、虚偽の政治的発言を識別することよりも AI にとって難しいかもしれません。

[[353377]]

百度百科事典によると、「風刺」とは、比喩や誇張などの手段を使って人や物を暴露したり批判したりすること、敵対的で後進的な物事を皮肉や嘲笑で描写すること、皮肉な目と嘲笑的な口調で他人に話すことを指します。

この明らかな皮肉は人間にとっては明らかですが、AI にとってはそう簡単ではありません。

2019年の最新の研究成果では、マルチモーダル検出用のAIモデルHFMが初めて導入され、精度は最大83％に達しました。最近、研究は飛躍的な進歩を遂げ、精度は 2.74% 向上しました。

この成果は、中国北京の情報工学研究所と中国科学院の共同研究チームによるものです。彼らが開発した新しいマルチモーダル AI 皮肉検出モデルは、Twitter データセットをテストした結果、86% の精度を達成しました。

研究者らは、2016年にマルチモーダル戦略の実験を開始し、Tumblr、Instagram、Twitterを含む複数のウェブデータセットでテストしたと述べた。

現在、この研究結果は AI マルチモーダル皮肉検出の最高レベルを表しており、コンピュータ言語学会 (ACL) や自然言語処理経験的手法学会 (EMNLP) など、多くのトップ NLP カンファレンスで発表されています。

「マルチモーダル検出」が主要な「皮肉」検出モードになっていることが分かっています。以前、ミシガン大学とシンガポール大学の研究者も言語モデルとコンピュータービジョンを使用してテレビ番組内の皮肉を検出しており、関連する研究もACLで発表されています。

それに比べて、この研究結果の技術的な特徴は何でしょうか?

技術原理

特別なのは、複数のモダリティ間で矛盾が見つかったことです。

マルチモダリティとは何ですか?公式の定義では、あらゆる情報源や情報形式がモダリティになり得るということです。たとえば、人間には触覚、聴覚、視覚、嗅覚があり、これらはすべて感覚様相です。

したがって、Twitter の投稿では、テキスト、画像、動画がそれぞれ 3 つのモードを表します。研究者らは、既存のマルチモーダル皮肉検出法は通常、マルチモーダル特徴を単純に連結するか、マルチモーダル情報を意図的に融合するだけで、モダリティ間およびモダリティ内の不一致は無視していることを発見した。

これに触発されて、彼らはこの問題を効果的に解決できる BERT アーキテクチャに基づくモデルを提案しました。

モデルフレームワーク

具体的には、研究者らは自己注意メカニズムの考え方を利用して、モーダル間の不一致を捉えるためのインターモーダル注意メカニズムを設計しました。図では、事前トレーニング済みの BERT モデルが、指定されたシーケンスとその中のハッシュタグをエンコードしています。 ResNet は画像形式を取得するために使用されます。テキスト内の不一致をモデル化するために Intra-modality attention を適用し、テキストと画像間の不一致をモデル化するために Inner-modality attention を適用します。矛盾する情報は結合され、予測に使用されます。

実験結果によると、提案モデルは公開されているマルチモーダル皮肉検出データセットで 86% という最先端のパフォーマンスを達成しました。

同時に、研究者らは予測率（Precision）、再現率（Recall）、正確性（Accuracy）、F1スコアの観点から、このモデルを既存のモデルベンチマークと比較しました。

結果は、現在の最先端の階層型融合モデル HFM と比較して 2.74% の改善を示しています。これは、微調整された BERT モデルと比較して 2.7% の改善です。図に示すように:

表からわかるように、画像特徴のみを使用するモデルのパフォーマンスはあまり良くありません (72.6%)。これは、マルチモーダル検出タスクでは、画像だけでは処理できないことを示しています。さらに、テキストベースの方法 (すべて 80% 以上) は、画像ベースの方法よりもパフォーマンスが優れています。したがって、皮肉な情報を検出するには、画像情報よりもテキスト情報の方が有用です。

さらに、微調整された BERT モデルは、他のテキストベースの事前トレーニングされていないモデルよりも優れたパフォーマンスを発揮し、BERT のような事前トレーニング済みモデルは検出タスクを改善できるという研究者の仮説を再び検証しました。これは、ビジョン + テキストモードのモデルが通常、他のモードよりも優れた結果を達成できることを示しています。同時に、画像が検出パフォーマンスの向上に役立つことも示しています。

テキストモダリティ内のモデルの観点から見ると、SIARN (80.5%) と SMSD (80.9%) の両方が矛盾した情報を考慮しており、TextCNN (80%) よりもパフォーマンスが優れていることは注目に値します。したがって、矛盾した情報は皮肉を識別するのに役立ちます。これにより、研究者が提案したモーダル間の矛盾検出方法が、単純なモーダル間接続方法よりも効果的であることが再び証明されました。

論文の詳細については、https://www.aclweb.org/anthology/2020.findings-emnlp.124.pdf をご覧ください。

<<: 人工知能を製造業に統合するのはどれくらい難しいのでしょうか?私の国のAI人材不足は30万人に達する

>>: プログラマーはAIアルゴリズムを使用して3,000匹の新しいポケモンを生成した