OpenAIは、テキストを使用してユーザーの感情を検出できる教師なし感情ニューロンを「巧みに」発見した。

OpenAIは、テキストを使用してユーザーの感情を検出できる教師なし感情ニューロンを「巧みに」発見した。

OpenAIは4月7日、公式サイトで最新の研究結果を発表し、感情表現を効率的に学習し、現在Amazonのレビューで次の文字を予測できる教師なしシステムを紹介した。

研究者らは線形モデルを使用して、小規模ながら広く使用されているデータセット (スタンフォード感情ツリーバンク) で非常に高い感情分析精度を達成しました。OpenAI は 91.8% の精度を達成しましたが、これまでの最高精度は 90.2% でした。このパフォーマンスは以前の教師ありシステムと同等ですが、ラベル付けされたサンプルの使用量も 30 ~ 100 倍少なくなります。

さらに、OpenAIは、そのモデルの表現には、ほぼすべての感情信号を含む独立した「感情ニューロン」も含まれていると述べた。

OpenAIは、「当社のシステムは、最小限のトレーニングデータでも、スタンフォード感情ツリーバンクでテストされた他のシステムよりも優れた結果を達成しています」と述べています。

完全教師あり学習の効果を実現するために、OpenAI のモデルはラベル付けされたサンプルを表す 2 つの変数 (緑と青の線) を選択し、各変数に対して 6920 個のサンプルをトレーニングしました (灰色の点線)。 OpenAI の L1 正規化モデル (Amazon ユーザーレビューを使用して教師なし方式で事前トレーニング済み) は、わずか 11 個のラベル付きサンプルでマルチチャネル CNN (畳み込みニューラル ネットワーク) と競合でき、232 個のトレーニング サンプルで最先端の CT-LSTM アンサンブルのレベルにまで達します。

OpenAIは、このモデルがAmazonのユーザーレビューの次の文字を予測するだけでなく、実際に感情の概念につながる可能性のある特徴を学習したので驚いたと述べた。 OpenAI は、この現象はこのモデルに特有のものではなく、入力の次のステップや次元を予測するようにトレーニングされることが多い一部の大規模ニューラル ネットワークの一般的な特性であると考えています。

トレーニング方法

Leifeng.com は、OpenAI がまず Amazon の 8,200 万件のユーザーレビューを使用して、4,096 ユニットの乗法 LSTM (mLSTM) をトレーニングし、短いテキスト内の次の文字を予測したことを知りました。チームは、1 時間あたり 12,500 文字を処理できる 4 つの Nvidia Pascal GPU を使用し、トレーニングには合計 1 か月かかりました。

これらの 4096 個のユニット (実際には浮動小数点数のベクトル) は、モデルによって読み取られた文字列の特徴ベクトルと見なすことができます。 mLSTM をトレーニングした後、OpenAI はこれらのユニットを線形に結合し、既存の教師ありデータを通じて結合の重みを学習し、元のモデルを感情分類器に変換します。

感情ニューロン

OpenAI は、L1 正則化を使用して線形モデルをトレーニングしているときに、驚いたことに、使用している学習ユニットが非常に少ないことに気づきました。さらに調査を進めた結果、研究者たちは、モデルの中に感情的価値を正確に予測できる「感情ニューロン」が実際に存在することを発見した。

モデルはテキスト内の次の文字を予測するようにのみトレーニングされていますが、モデル内の感情ニューロンはレビューを否定的または肯定的として分類できます。

他の同様のモデルと同様に、OpenAI のモデルを使用してテキストを生成できますが、違いは、OpenAI はニューロンの値を書き換えることで合成テキストの感情を制御できることです。

上の画像は、トレーニングされたモデルによって生成された合成テキストの例です。研究者らはまず感情ニューロンの値を決定し、次にモデルからサンプルをランダムに選択してコメントの感情を判定した。下の図に示すように、研究者は「わかりませんでした」という接頭辞もモデルに渡して、非常に類似したサンプルのみを選択しました。

次の図は、感情ニューロンによって表される各文字の値を示しています。赤は負、緑は正です。 「最高」や「ひどい」などの強い示唆を与える単語は、濃い色で強調表示されます。

文章やフレーズを完成した後、システムが頻繁に更新を行うことは注目に値します。たとえば、「そして、そのうちの約 99.8 パーセントは映画の中で失われました」という文では、「映画の中で」自体には感情的な内容はありませんが、モデルは「失われた」の後に否定的な更新を行い、文の終わりの後に別の大きな更新を行います。

教師なし学習

ラベル付けされたデータは機械学習の原動力となります。データの収集は簡単ですが、大規模にラベル付けするのは困難です。大規模なデータのラベル付けは、機械翻訳、音声認識、自動運転など、目に見える効果と利益がある分野でのみ実現可能です。

機械学習分野の研究者は長い間、データセットの正確な表現を学習できる教師なし学習アルゴリズムを開発し、ラベル付けされたデータがほとんどない問題を解決したいと夢見てきました。 OpenAI の研究は、大量のデータを使用して大規模な教師なしの次のステップ予測モデルを単純にトレーニングすることが、優れた表現学習機能を備えたシステムを作成するための優れたアプローチである可能性があることを示唆しています。

次のステップ

OpenAI の研究結果は、一般的な教師なし表現学習における前進を表しています。研究者たちは、言語モデル化を通じて高品質の表現を学習できるかどうかを探り、慎重に選択されたデータセットで既存のモデルを拡張しているときに、この結果を偶然発見しました。しかし、研究者たちはこの潜在的な現象の具体的な原因についてはまだよくわかっていません。

これらの結果は、長いドキュメントを含むデータでは適切に機能しません。 OpenAI は、彼らのモデルが数百、あるいは数千の時間ステップにわたって情報を記憶するのに問題があるのではないかと推測しています。階層モデルは対応する時間スケールに適応できるため、次のステップは階層モデルを試すことであると彼らは考えています。これらのモデルをさらに拡張すると、感情分析や同様のタスクにおける表現の忠実度とパフォーマンスがさらに向上する可能性があります。

入力テキストとレビュー データの違いが大きいほど、モデルのパフォーマンスは低下します。テキストサンプルのコーパスを拡張することで、より広範囲のドメインに適用できる同様に有益な表現を得られるかどうかを検証することは価値があります。

OpenAI の結果は、大規模な次のステップ予測モデルが優れた教師なし表現を学習できることを示しています。大規模なビデオ コレクションを使用して、大規模なニューラル ネットワークをトレーニングし、次のフレームを予測すると、オブジェクト、シーン、アクション分類子の教師なし表現が生成される可能性があります。

一般的に、モデル、そのトレーニング方法、データセットのプロパティを理解することが重要です。そうすることで、同様の優れた表現が得られる可能性が高くなります。

<<:  自然言語処理におけるディープラーニングの応用

>>:  李開復氏独占インタビュー:10年後には人間の仕事の50%がAIに置き換えられる

ブログ    
ブログ    

推薦する

ディープラーニングの深層: モデリング知識とオープンソースツールのオプション

[51CTO.com クイック翻訳] この記事では、ディープラーニングアルゴリズムを使用してデータモ...

...

JD Digits の AI ロボットが物理産業に貢献し、業界賞を受賞

電気の「ジュージュー」という音が響くコンピューター室では、「スマートガーディアン」コンピューター室検...

ロボットの台頭:伝統産業を変革する新技術

アルゴリズムの時代が到来しました。 Google、Amazon、AppleなどのIT大手が開発した、...

人工知能の発展を推進する4つの技術

[[419350]] 「人工知能」という用語は 1956 年に初めて登場しました。人工知能とは、機械...

YOLOv6: 高速かつ正確な物体検出フレームワークがオープンソース化

著者: Chu Yi、Kai Heng 他最近、Meituan のビジュアル インテリジェンス部門は...

AIチップのスタートアップ企業CambrianがシリーズB資金調達で数億ドルの完了を発表

本日、AIチップのスタートアップ企業Cambrianが数億ドルのBラウンド資金調達を完了した。資金調...

顔認識の乱用は顔だけでなく他の部分にも害を及ぼす

[[432791]]中国消費者協会(以下、「中国消費者協会」)は10月28日、事業者に対し、個人情報...

賈陽青氏がフェイスブックを辞任し、アリババ・シリコンバレー研究所の副社長に就任したことが明らかになった。

[[258639]] 3月2日の夜、知书でAI人事異動に関する大きなニュースが報じられた。Caff...

20以上のモバイルハードウェア、Int8超高速推論、エンドサイド推論エンジンPaddle Lite 2.0が正式にリリースされました

PaddlePaddleは今年8月、端末やエッジデバイス向けのエッジ推論エンジン「Paddle Li...

ビッグデータの発展は、ソフトウェアエンジニアの漸進的な衰退とアルゴリズムエンジニアの台頭を伴うことになる。

[[190402]]ビッグデータは人類の歴史のどの時代にも存在していましたが、テクノロジーが一定の...

ビル・ゲイツ:中国がAIで他国を追い抜くとは思わない

マイクロソフトの創業者ビル・ゲイツは、現在のAIの開発動向についてどう考えているのでしょうか?最近の...

GPT-5 プレビュー!アレン人工知能研究所がGPT-5の新機能を予測する最も強力なマルチモーダルモデルを発表

GPT-5 はいつ登場し、どのような機能を持つのでしょうか?アレンAI研究所の新しいモデルがその答え...

GPT-4 は AGI です! Googleとスタンフォード大学の科学者が、大規模モデルがいかにして超知能化できるかを明らかに

汎用人工知能(AGI)は実際に実現されているのでしょうか?最近、Google Research と ...

倪光南学士がRAG技術、AIエージェント、AI倫理的課題について語る

中国工程院の院士である倪光南氏は、第2回北京人工知能産業革新発展会議で人工知能の発展に関する見解と経...