LSTM の父が LLaMA 2 を激しく非難: 私のアイデアをコピーして私を辱めた!ネットユーザー:それをしたのはLeCunですか?

LSTM の父が LLaMA 2 を激しく非難: 私のアイデアをコピーして私を辱めた!ネットユーザー:それをしたのはLeCunですか?

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

LLaMA は「面倒なこと」とも言えます。

新しいバージョンがリリースされて間もなく、LSTM の父である Jürgen Schmidhuber 氏から批判を受けました。

「口を開ければ食べ物が出てくる」だけならいいのですが、実際に「ボウルを置いて母親を呪う」のですか?

シュミットフーバー氏は、メタ氏が1991年に彼が提案したアイデアをLLaMA 2のトレーニングに使用したが、LLaMAは彼に対して激しい中傷キャンペーンを開始したと述べた。

当初、ネットユーザーは、LLaMA 2にシュミットフーバーについて質問したところ、予想外の返答が返ってきたことに気づいた。

申し訳ありませんが、ネガティブな背景を持つ人々に関する情報を提供することはできません...

LLaMAはまた、シュミットフーバー氏は「有害な活動に従事し」、「社会に貢献しなかった」とも述べた。

一部のネットユーザーは、この答えはLeCun氏によってハードコードされたのではないかと推測した。

LLaMA が故意にそうしたのか、それとも偶然にそうしたのかを検証することは不可能だが、そのニュースがシュミットフーバー氏の耳に届いたことは確かだ。

シュミットフーバー氏はメタ氏とルカン氏に説明を求めたが、これまでのところどちらからも返答はない。

「ルカンは私のアイデアの多くを盗んだ」

Schmidhuber が言及した 1991 年の研究は、Transformer の線形 (正規化されていない) バリアントです。

シュミットフーバー氏によると、これはトランスフォーマーの最も初期の亜種でもあるという。関連する論文は 1992 年に発行され、1993 年に ICANN に掲載されました。

さらに、シュミットフーバー氏によれば、ルカン氏はすでに「業績を盗む」という点で「常習犯」だという。

LLaMA だけでなく、LeCun の業績の多くも彼のアイデアを利用していましたが、彼はそれが最初のものであると主張しました。

シュミットフーバー氏は、2017年にはすでにMeta(当時はFacebookと呼ばれていた)が彼が発明したLSTMを使用していたと述べた。

しかし、当時のFacebookの発表ではシュミットフーバー氏の名前は出ていなかった。

彼は、LSTM は自分で発明したとさえ言っています。

たとえば、2022年に、LeCun 氏は過去 10 年間の AI 分野における 5 つの最も重要なブレークスルーをまとめました。

シュミットフーバー氏は、これらの結果のほとんどは彼の研究室から得られたものだと語った。

  • 自己教師学習は実際には1991年からのRNNを積み重ねている
  • ResNetは2015年のハイウェイネットです
  • 3と4は1991年のファストウェイトです
  • 5は実際には1991年のリニアトランスフォーマーの派生型である

当時、ルカン氏は率直に反応し、シュミットフーバー氏について皮肉な発言をした。

ライト兄弟より前に飛行機を発明した人がいましたが、飛行距離は50メートル未満しかなかったため、誰も彼(アダー)の名前を覚えていませんでした。
シュミットフーバーが作った模型はアダーの飛行機と全く同じで、一番初期のものであったにもかかわらず役に立たなかった。

その後、シュミットフーバー氏は、ルカン氏の自律機械知能に関する論文を取り上げました。

シュミットフーバー氏は、論文には1990年から2015年までの結果が含まれているが、引用はしていないと述べた。

この論文で「盗まれた」結果を完全に表示するために、シュミットフーバー氏は関連する内容を詳細にリストする特別なウェブページも作成しました。

ここでは詳細には触れませんが、LeCun 氏がどう反応したかを見てみましょう。

ルカン氏は最初、「建設的な提案をすることはできないでしょうか」と言葉を詰まらせ、その後こう言った。

私の論文では、多くの概念が長い間存在してきたと述べました。なぜ、あなたはそれらに固執するのですか?
さらに、トレーニング可能な世界モデルは、システム認識の中心的なアイデアです。
初期の頃について言えば、1980 年代にニューラル ネットワークを使用して人間の世界を研究する人がいましたが、それは 1991 年のあなた方よりも早かったのではないですか?

そして戦争は今年まで続いています。

2月にシュミットフーバー氏は、ルカン氏が自身の間違いを認めず、論文を適切に擁護もせず(OpenReview)、シュミットフーバー氏について極めて誤解を招くようなコメントをしたとツイートした。

LLaMA 2 がシュミットフーバー氏を攻撃する発言をしたことが暴露されるまで、両者の争いは収まらなかったようだ。

もう一つ

「アルパカ事件」発生後、一部のネットユーザーは冗談で「シュミットフーバーエド」という新語を作り出した。

「シュミットフーバー症候群」の症状には以下のものがあります。

  • 私は本当に良いものを発明したのですが、誰も気に留めず笑われました。
  • 数年後、このアスペクトは再び人気を博しましたが、その種のものとしては初めてのものだったと言われています。
  • 彼が最初の発明者だったことを説明し始めた
  • 結局、誰も気にしなかったし、みんなあなたがそう思っていたんだ🍋
  • 名前を動詞にする

シュミットフーバー氏の言うことが真実であれば、その言葉の説明は彼の経験を生き生きと描写していることになる。

ルカンは今回どのような対応をするのでしょうか?しばらく弾丸を飛ばしましょう...

<<:  IoT と AI を組み合わせたユースケースにはどのようなものがありますか?

>>:  精度がわずか26%だったため、OpenAIはAIテキスト検出ツールをひっそりと終了した。

ブログ    
ブログ    

推薦する

...

OpenAI セキュリティシステムディレクターが長文記事を執筆: 大規模モデルに対する敵対的攻撃と防御

ChatGPTのリリースにより、大規模な言語モデルのアプリケーションが加速し、大規模に展開されていま...

ビッグデータとAIアプリケーションを成功させる4つの鍵

ビッグデータ技術が今や世界の主要なマーケティングツールの 1 つになっていることは周知の事実です。 ...

機械学習: IoT 成功の秘訣?

モノのインターネット (IoT) に匹敵する潜在力を持つテクノロジーはほとんどなく、IoT はほぼす...

AIを活用して衛星画像を判別、世界初「全世界の船舶足跡マップ」を公開

1月4日、研究者のデイビッド・クルーズマ氏はナショナルジオグラフィックとブルームバーグ・フィランソロ...

ドキュメント内の単語が増えるほど、モデルは興奮します。 KOSMOS-2.5: テキストが密集した画像を読み取るためのマルチモーダル大規模言語モデル

注目すべき傾向は、印象的な言語出力を生成できる、数百億/数千億のパラメータを備えた、より大規模で複雑...

企業は2024年に台頭するテクノロジーの波にどのように対応すべきでしょうか?

2023年は科学技術にとって重要な年と言えます。AI、モノのインターネット、ビッグデータ、クラウド...

建設業界における人工知能の応用

研究によると、建設業界では、計画や建設のいずれの用途でも、人工知能技術の応用がますます一般的になりつ...

LLMが互いに戦うことを学ぶと、基本モデルは集団進化の先駆けとなるかもしれない

金庸の武侠小説には両手で戦うという武術が登場します。これは周伯同が桃花島の洞窟で10年以上の厳しい修...

オンラインレビューの 7 分の 1 は偽物です。人工知能は役に立つでしょうか?

目視で観察すると、コメント欄は中国文学の巨匠の密度が比較的高く、侮辱やおどけのレベルも比較的高く、A...

市場動向 | 人工知能が光接続の需要を急増させる

世界のデジタル経済が急速に発展するにつれ、クラウド コンピューティングによってデータ転送速度に対する...

図解機械学習: 誰でも理解できるアルゴリズムの原理

機械学習の話題は誰もが話題にするほど普及していますが、それを完全に理解している人はほとんどいません。...

...

...

AI「コスプレ」の鍵はキャラクター設定にあり!復旦大学、人民大学などがビッグファイブ性格特性+MBTIテストを発表:特性回復率は82.8%に達し、OOCを否定

好きなアニメ小説のキャラクターとチャットしてみませんか?バーチャルコンパニオンが欲しいですか?あなた...