中国の研究チームが86%の精度を誇るAI「皮肉」検出モデルを発表

中国の研究チームが86%の精度を誇るAI「皮肉」検出モデルを発表

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

最近は、インターネットなどでもベルサイユ文学的な雰囲気が強く出ています。

[[353374]]

本当にイライラします。寝過ごしてモルディブ行きの飛行機に乗り遅れたので、プライベートジェットで行かなければなりません。

一見平易な言葉の中に、派手な見せびらかしの感覚がある。これがベルサイユ文学である。

[[353375]]

毎年「ベルサイユ文学」などのネット流行語が生まれますが、その意味を本当に理解していますか?

まずはちょっとしたテストをしてみましょう!

次の3つの文章のうち、どれが風刺文、苦情文、ベルサイユ文学であるか判断してください。

  • この社会では、どんなに批判に耐えなければならないとしても、耐える必要はありません。なぜなら、今では偽善はもはや偽善とは呼ばれず、高い感情的知性と呼ばれるからです。
  • 君にとって醜いことは本当に難しい。朝は人々を怖がらせるために、夜は幽霊を怖がらせるために外へ飛び出すんだ。
  • iPhone 11 Pro Max は本当に使いにくいです。私のは動かなくなってしまいました。512g のダークグリーンのものです。実際、それです。1024g を購入する必要があります。

答えが正しかったとしても、自慢しないでください。AI でもこの質問に答えられる可能性があるからです。

最近、北京の情報工学研究所と中国科学院は共同で、皮肉を識別する精度が86%のAIモデルを立ち上げた。

なお、この研究成果は計算言語学協会(ACL)に掲載されました。

これを聞いて、なぜ AI が「皮肉」を認識する必要があるのか​​と疑問に思うかもしれません。 ? ?

AI「皮肉」モデル

実際、感情を表現する方法としての皮肉は、AI 感情分析の重要な研究方向です。

感情分析は、傾向分析または意見マイニングとも呼ばれ、感情的な意味合いを持つ主観的なテキストを分析、処理、要約、および推論するプロセスです。感情分析機能を利用することで、主観的な説明を含む自然言語テキストの肯定的または否定的な感情傾向を自動的に判断し、対応する結果を提供することができます。

それは何の役に立つのでしょうか?簡単な例を挙げてみましょう。

今回の米国選挙で、バイデン氏とトランプ氏の2つの関係者以外で最も頭を悩ませているのは、フェイスブックの創設者マーク・ザッカーバーグ氏かもしれない。

[[353376]]

常に「言論の自由」で知られているフェイスブックは、米大統領選の期間中、ソーシャルネットワーク上に「虚偽の政治的発言」が掲載されないようにしなければならない。

巨大なソーシャル ネットワークでは毎日何千もの投稿が公開されています。政治的リスクのある投稿とそうでない投稿を判断するために、投稿を 1 つ 1 つ手動で確認して削除するのは明らかに非現実的です。

ここで AI が役に立ちます。

米大統領選のずっと前から、FacebookのAI研究チームはAI言語モデルを使い、インターネット上の虚偽情報やヘイトスピーチを特定し始めていた。統計によると、2020年第1四半期にFacebookはXLM言語モデルを使ってヘイトスピーチを含む960万件の投稿を削除した。

この点に関して、フェイスブックの最高技術責任者マイク・シュローファー氏も次のように述べた。

私は、AI が日常の問題を解決できると考えるほど世間知らずではありませんが、AI はいくつかの一般的なタスクだけでなく、人間には到底できない数十億規模の面倒なタスクにも確実に役立つと考えています。

この例では、AI の難しさは、感情分析機能を向上させ、虚偽の政治的発言を含む投稿を正確に識別する方法にあります。

しかし比較すると、皮肉を識別することは、虚偽の政治的発言を識別することよりも AI にとって難しいかもしれません。

[[353377]]

百度百科事典によると、「風刺」とは、比喩や誇張などの手段を使って人や物を暴露したり批判したりすること、敵対的で後進的な物事を皮肉や嘲笑で描写すること、皮肉な目と嘲笑的な口調で他人に話すことを指します。

この明らかな皮肉は人間にとっては明らかですが、AI にとってはそう簡単ではありません。

2019年の最新の研究成果では、マルチモーダル検出用のAIモデルHFMが初めて導入され、精度は最大83%に達しました。最近、研究は飛躍的な進歩を遂げ、精度は 2.74% 向上しました。

この成果は、中国北京の情報工学研究所と中国科学院の共同研究チームによるものです。彼らが開発した新しいマルチモーダル AI 皮肉検出モデルは、Twitter データセットをテストした結果、86% の精度を達成しました。

研究者らは、2016年にマルチモーダル戦略の実験を開始し、Tumblr、Instagram、Twitterを含む複数のウェブデータセットでテストしたと述べた。

現在、この研究結果は AI マルチモーダル皮肉検出の最高レベルを表しており、コンピュータ言語学会 (ACL) や自然言語処理経験的手法学会 (EMNLP) など、多くのトップ NLP カンファレンスで発表されています。

「マルチモーダル検出」が主要な「皮肉」検出モードになっていることが分かっています。以前、ミシガン大学とシンガポール大学の研究者も言語モデルとコンピュータービジョンを使用してテレビ番組内の皮肉を検出しており、関連する研究もACLで発表されています。

それに比べて、この研究結果の技術的な特徴は何でしょうか?

技術原理

特別なのは、複数のモダリティ間で矛盾が見つかったことです。

マルチモダリティとは何ですか?公式の定義では、あらゆる情報源や情報形式がモダリティになり得るということです。たとえば、人間には触覚、聴覚、視覚、嗅覚があり、これらはすべて感覚様相です。

したがって、Twitter の投稿では、テキスト、画像、動画がそれぞれ 3 つのモードを表します。研究者らは、既存のマルチモーダル皮肉検出法は通常、マルチモーダル特徴を単純に連結するか、マルチモーダル情報を意図的に融合するだけで、モダリティ間およびモダリティ内の不一致は無視していることを発見した。

これに触発されて、彼らはこの問題を効果的に解決できる BERT アーキテクチャに基づくモデルを提案しました。

モデルフレームワーク

具体的には、研究者らは自己注意メカニズムの考え方を利用して、モーダル間の不一致を捉えるためのインターモーダル注意メカニズムを設計しました。図では、事前トレーニング済みの BERT モデルが、指定されたシーケンスとその中のハッシュタグをエンコードしています。 ResNet は画像形式を取得するために使用されます。テキスト内の不一致をモデル化するために Intra-modality attention を適用し、テキストと画像間の不一致をモデル化するために Inner-modality attention を適用します。矛盾する情報は結合され、予測に使用されます。

実験結果によると、提案モデルは公開されているマルチモーダル皮肉検出データセットで 86% という最先端のパフォーマンスを達成しました。

同時に、研究者らは予測率(Precision)、再現率(Recall)、正確性(Accuracy)、F1スコアの観点から、このモデルを既存のモデルベンチマークと比較しました。

結果は、現在の最先端の階層型融合モデル HFM と比較して 2.74% の改善を示しています。これは、微調整された BERT モデルと比較して 2.7% の改善です。図に示すように:

表からわかるように、画像特徴のみを使用するモデルのパフォーマンスはあまり良くありません (72.6%)。これは、マルチモーダル検出タスクでは、画像だけでは処理できないことを示しています。さらに、テキストベースの方法 (すべて 80% 以上) は、画像ベースの方法よりもパフォーマンスが優れています。したがって、皮肉な情報を検出するには、画像情報よりもテキスト情報の方が有用です。

さらに、微調整された BERT モデルは、他のテキストベースの事前トレーニングされていないモデルよりも優れたパフォーマンスを発揮し、BERT のような事前トレーニング済みモデルは検出タスクを改善できるという研究者の仮説を再び検証しました。これは、ビジョン + テキスト モードのモデルが通常、他のモードよりも優れた結果を達成できることを示しています。同時に、画像が検出パフォーマンスの向上に役立つことも示しています。

テキスト モダリティ内のモデルの観点から見ると、SIARN (80.5%) と SMSD (80.9%) の両方が矛盾した情報を考慮しており、TextCNN (80%) よりもパフォーマンスが優れていることは注目に値します。したがって、矛盾した情報は皮肉を識別するのに役立ちます。これにより、研究者が提案したモーダル間の矛盾検出方法が、単純なモーダル間接続方法よりも効果的であることが再び証明されました。

論文の詳細については、https://www.aclweb.org/anthology/2020.findings-emnlp.124.pdf をご覧ください。

<<:  人工知能を製造業に統合するのはどれくらい難しいのでしょうか?私の国のAI人材不足は30万人に達する

>>:  プログラマーはAIアルゴリズムを使用して3,000匹の新しいポケモンを生成した

ブログ    

推薦する

90年代以降は人工知能で年間数百万ドルを稼ぐ、Google、Microsoft、BATの給与リストが明らかに

年末には給与に関する議論が再び盛り上がる。昨日、馬化騰氏は抽選で従業員に30万元相当のテンセント株1...

配達員はSF映画のハイテク技術を駆使し、平地を歩いているかのように100キロの重量を運ぶ。

昨日、配達員の動画がインターネット上で話題になった。動画では、ハミングバードデリバリーの配達員がテイ...

機械はどのように学習するのでしょうか?人工知能の「双方向戦闘」を詳しく解説

金庸の武侠小説『射雁英雄伝』には、桃花島に閉じ込められた「悪童」周伯同が「左右の格闘術」を編み出した...

今日のトーク: 人工知能、ロボット、そして中国のバレンタインデー

[[417375]]あと一日で中国のバレンタインデーになります。遠く離れたアルタイルと明るいベガは、...

5 つの主要分野をカバーする、知っておくべき 21 のオープンソース機械学習ツール

この記事では、まだ使ったことがないかもしれないオープンソースの機械学習ツールを21個紹介します。各オ...

このAIは、監視対象を素早く検索するのに役立ちます:テキスト配置キーフレーム、24時間のビデオ録画10分処理

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

【受賞討論会】「スマート運用・保守」がトレンドに。運用・保守エンジニアは人工知能に置き換えられるのか?

特にインフラとして重要な役割を担うデータセンターにおいては、運用・保守は決して軽視できるものではなく...

世界主要7カ国のAI戦略を総ざらい

21 世紀が近づくにつれ、各国の成功または失敗はもはや国民と政府指導者だけに依存するものではなくなり...

...

XNOR-NETテクノロジー詳細解説:AIテクノロジーがモバイル端末に搭載され、新時代が到来

[[187849]]この時代、人間の生活はスマートデバイスから切り離すことはできません。持ち歩く携帯...

ソラ爆発的人気の裏側|世界のモデルとは何かを語ろう!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

イノベーションを統合し、障壁を下げ、PaddlePaddleは人工知能を推進して大規模な工業生産を実現します。

5月20日、中国国家深層学習技術応用工程研究室と百度が共催する「WAVE SUMMIT 2021 ...

危険なAIアルゴリズムを識別し、倫理原則に従ったビッグデータモデルを作成する方法

人工知能がもたらす脅威について議論するとき、スカイネット、マトリックス、ロボットによる終末の世界とい...