OpenAI Microsoftが訴えられる!ニューヨークタイムズはAIが著作権を侵害していると非難し、侵害モデルとトレーニングデータの破棄を要求している。

OpenAI Microsoftが訴えられる!ニューヨークタイムズはAIが著作権を侵害していると非難し、侵害モデルとトレーニングデータの破棄を要求している。

OpenAI はおそらく歴史上最も困難な AI 著作権訴訟に直面している。

原告のニューヨーク・タイムズは、22万ページに及ぶ添付書類を添えた訴状を地元の裁判所に提出した。

あるセクションには、ChatGPT の出力がニューヨーク タイムズのニュース コンテンツとほぼ同じであることを示す確固たる証拠が 100 個もリストされています。

このニュースはすぐにネットワーク全体の注目を集め、OpenAI を驚かせました。広報担当者は、これは事実だと答え、「状況がこのように発展するとは予想していませんでした」と述べました。

驚きと失望にもかかわらず、彼らは「他の多くの出版社と行ってきたように、相互に有益な協力方法を見つけることを期待している」とも述べた。

マイクロソフトも訴えられている。おそらく今回は、他の出版社の場合のように簡単に訴訟を放棄することはできないだろう。

TechCrunchによると、ニューヨーク・タイムズはOpenAIとマイクロソフトに対し、著作権を侵害する素材を含むモデルとトレーニングデータを破棄し、ニューヨーク・タイムズの独自かつ貴重な作品の違法なコピーと使用に関連する「法定および実際の損害賠償金として数十億ドル」の責任を負うよう求めた。

ニューヨーク・タイムズは、知的財産権紛争で生成AI企業を訴えた最初の出版社ではないが、強力な証拠と強力な法務チームを擁し、これまでこうした訴訟に参加した最大規模の出版社の一つである。

ネットユーザーらは「AI侵害の画期的な事例を目撃する」ことも呼びかけた。

別の弁護士である@Cecilia Ziniti氏も、訴状を詳細に分析した後、「これは、生成AIを侵害で訴えるこれまでの最良のケースだ」と述べた。

この場合、何に注目する価値があるか見てみましょう。

「AI侵害の画期的な事例となる可能性がある」

セシリア・ジニティ氏は、この件で OpenAI にとって不利ないくつかの重要な点を分析しました。

  • ニューヨークタイムズの記事が AI のトレーニングに使用できる単一のデータセットを構成しているという証拠があります。
  • 証拠は十分であり、視覚的に明確で目を引くものである。
  • ニューヨークタイムズの詳細な記事は創造性を反映しています。
  • 訴訟では、OpenAI は営利志向の企業である一方、ジャーナリズム業界は一定の公共福祉の性質を持っていると説明されている。
  • モデルは幻覚を起こし、偽のニュースを捏造します。
  • 強力な弁護士チーム。

これらについて一つずつ詳しく説明しましょう。

まず、訴状には著作権侵害の主張が明確に記載されており、 ChatGPT の成果物とニューヨーク タイムズの記事との間の「アクセスと実質的な類似性」が強調されています。

重要な事実:ニューヨーク タイムズの記事は、インターネット データをスクレイピングするためのオープン プラットフォームであるCommon Crawl から GPT をトレーニングするために使用された最大の単一の独自データセットです。

第二に、訴状に記載されている盗作の証拠は視覚的に極めて明確で目を引くものである。 GPT によって生成された新しい単語は黒でマークされ、コピーされたテキストは赤でマークされます。このコントラストは陪審員の判断に影響を与える可能性があります。

セシリア・ジニティ氏は個人的に、OpenAIが指示を大幅に変更せず、法廷で技術的原理を詳細に説明しなければ、同社がこの行為を弁護するのは非常に困難になると考えている。

彼女の意見では、OpenAI にとって、裁判ではなく和解を選択する方がより合理的なアプローチとなるだろう。

さらに、OpenAIにとって不利な点として、今回の訴訟の原告がニューヨーク・タイムズ紙であり、記事そのものだけでなく、独創性や創作プロセスも問題となっていることが挙げられます。

訴状にあるように、タクシーローンに関する徹底的な暴露など、ニューヨーク・タイムズの徹底的な調査報道は労働の成果であるだけでなく、核心的な創造性を反映している。

重要な点は、著作権は努力そのものではなく、イノベーションを保護するということです

タクシーの記事にある600件のインタビューは確かに印象的ですが、法的な観点から見ると、より重要なのは報告アプローチの革新性です。これは、わずか数行のオープンソースコードしか関係しなかった GitHub Copilot に対する訴訟とはまったく対照的です。

しかし、交渉が失敗すれば、ニューヨーク・タイムズは莫大な損失を被る可能性がある。

ニューヨーク・タイムズは4月にOpenAIとの交渉を試みたが失敗し、OpenAIは合意に達することを拒否したと言われている。特にOpenAIの利益増大や同様の訴訟の増加を考えると、その金額は莫大なものになる可能性が高い。

セシリア・ジニティ氏の大胆な推測では、OpenAI は 7 桁から 8 桁の金額でこの問題を解決できると考えていた可能性があるという。しかし、ニューヨーク・タイムズが求めているのは、より高い報酬と継続的な著作権収入なのかもしれない。

この苦情では、OpenAI が営利を追求する閉鎖的な企業であるとも描写されており、この点はジャーナリズムの公共心との対比によって強調されている。

苦情には、取締役会とサム・アルトマン氏との間の論争についても言及されている。

セシリア・ジニティは、この物語は著作権の社会的価値と技術革新の間のトレードオフを探求しているため、法廷で非常に大きな影響力を持つ可能性があると主張している。

もう一つの非常に重要なポイントは、モデルの錯覚です。

訴状では幻覚が紹介され、それを根拠にニューヨーク・タイムズの記事から捏造された要素を引用している。

最も印象的な例の 1 つとして、Bing は、オレンジ ジュースがリンパ腫を引き起こすという記事をニューヨーク タイムズが掲載したと主張しました。

最後に注目すべき点が 1 つあります。ニューヨーク タイムズは非常に優秀な法務チームを雇用しています。 Susman Godfrey LLP は、挑戦的なテクノロジー企業において卓越した評判と豊富な経験を誇ります。

この訴訟は、ChatGPT がリリースされてから 1 週間後に提起された訴訟のような利益追求型の訴訟ではなく、戦略的な法的挑戦です。

さらに、より多くのネットユーザーが訴訟に関連するコンテンツを追加しました。例えば、米国のデジタルメディアエージェンシーDCNのCEO、ジェイソン・キント氏は次のように指摘した。

マイクロソフトも明らかに同じです。この文書には、ニューヨークタイムズの記事からそのままコピーされたコンテンツの例が示されています。

これは、Microsoft 独自の検索エンジンを使用した検索比較です。コンテンツの重複の処理の違いはすぐに明らかであり、議論の余地はありません。

ウォートン校のイーサン・モリック教授も次のように指摘している。

トレーニング データと出力結果の複雑な関係は、OpenAI に対するニューヨーク タイムズの訴訟で明らかになっています。 ChatGPT は、有名なニューヨークタイムズの記事の正確な内容を再現できる一方で、ChatGPT には誤った記事や誤った記事を生成する可能性があることも指摘しています。

数十億ドルの責任

冒頭で述べたように、ニューヨーク・タイムズは賠償額がいくらなのか直接言及しなかったものの、OpenAIとマイクロソフトが「数十億ドルの法的損害と実際の損害」に対して責任を負うことになるだろうと示唆した。

では、これらの損失はどこから来るのでしょうか?

ニューヨーク・タイムズは、AIが自社の記事の内容を再現するのは著作権料ほど単純なことではないと指摘し、「OpenAIとマイクロソフトは実際にニューヨーク・タイムズの成果を利用して、ニュース出版社の競争相手を構築している」と述べた。

AIはサブスクリプションベースの情報を提供するだけでなく、適切に引用されないことが多く、商業的な利益のために利用されることもあり、ニューヨークタイムズが手数料を得るために使用する関連リンクを削除することもあります。

これはニューヨークタイムズにとって直接的な損失です。

さらに、モデルは誤った情報を提供するため、ブランドに影響を与え、大きな損失にもなります。

今回、OpenAIとMicrosoft AIが権利を侵害したという確固たる証拠があるようです。しかし、OSSキャピタルの創設パートナーであり知的財産顧問のヘザー・ミーカー氏は、ニューヨーク・タイムズがこの訴訟に勝つ可能性は低いと指摘した。

彼は、苦情の中で、ChatGPT が 2012 年のレストランレビュー記事の内容を再現するために使用された例を指摘しました。ユーザーはまず ChatGPT にレビューの最初の段落について質問し、次に次の文について質問します。

ミーカー氏は、 AIに元の入力内容を繰り返すように誘導することは、侵害の合理的な根拠にはならないと考えています。ユーザーが意図的に AI にコンテンツをコピーさせた場合、その責任はユーザーにあります。

「だからこそ、このような訴訟のほとんどは失敗する可能性が高いのです。」

もう一つ

OpenAIとMicrosoftがデータをめぐって訴訟を起こしている一方で、Appleは問題を解決するために金銭を支払っているだけだ。

Appleは最近、大手出版社数社と合意に達し、同社のコンテンツデータをAIのトレーニングに利用できるようになると報じられている。

アップルはまた、長期契約を締結したいとしており、提案されている取引額は少なくとも3億5,700万ドルとなる。

「AppleGPT」と呼ばれるモデルは社内でテスト中と言われており、来年のSiriの新バージョンに導入される可能性がある。

最近のデータはすごくいいですよね〜

<<:  2024年までにAIがすべての仕事をどう変えるのか

>>:  バイトマルチモーダル大規模モデル PixelLM: SA に頼らない効率的なピクセルレベル推論

ブログ    
ブログ    

推薦する

...

...

2021 年に企業に影響を与える自然言語処理のトレンド

[[384737]] [51CTO.com クイック翻訳] 昨今、自然言語技術は企業でますます活用さ...

KDnuggets 調査 | データ サイエンティストが最もよく使用するアルゴリズム トップ 10

翻訳 | 江凡百理子杰樹校正 | ロリン最新の KDnuggets 調査では、データ サイエンティス...

...

マスク氏が「ブレインカッター」を募集! Neuralink が初の人体実験を公式に発表。ALS 患者は「数秒でホーキング博士に変身」するのでしょうか?

マスク氏の世界で「脳コンピューターインターフェース」を開発している企業、Neuralink は本日、...

古代のLRから始まる初心者でもわかるレコメンデーションアルゴリズム入門

[[386397]]みなさんこんにちは。私は、気づかないうちに長い間、推薦システムに取り組んできまし...

目の反射神経が 3D の世界を開き、ブラック ミラーを実現します。メリーランド州出身の中国人による新作がSFファンを熱狂させる

「唯一の真の発見の旅は、未知の土地を訪れることではなく、他人の目を通して宇宙を見ることだ。」 - マ...

旅行業界における機械学習と AI: 5 つの重要な業界ユースケース

旅行を計画していると想像してください。 数十年前であれば、旅行先や宿泊施設の選択肢を調べたり、航空券...

スマートドライビングが誕生してから10年経った今、なぜ理想的なビジネスモデルの実現が難しいのでしょうか?

[[420239]] 2011年7月14日、紅旗HQ3は長沙から武漢までの286キロの高速道路を疾...

分散型コンセンサスアルゴリズム: 想像以上に複雑

1. 分散システムの難しさ張大鵬は難しい問題に遭遇した。彼らの会社には貴重なデータを保存しているサー...

賢明な企業はヘルスケアにおける認知AIの成功から学ぶことができる

認知技術は世界最大の課題を解決するために使用されています。この記事では、企業が認知 AI をどのよう...

...

...

アリババが自社開発の音声認識モデルDFSMNをオープンソース化、精度は最大96.04%

[[232541]]最近、アリババDAMOアカデミーの機械知能研究所は、新世代の音声認識モデルDF...