ロイター通信は12月13日、著作権侵害訴訟の新たな文書によると、メタ・プラットフォームズは何千冊もの海賊版書籍を使ってAIモデルを訓練することには法的リスクがあることを知っていたにもかかわらず、それでもそうすることを主張していたと報じた。 IT Homeによると、この訴訟はコメディアンのサラ・シルバーマン、ピューリッツァー賞受賞者のマイケル・シェイボン、その他の有名作家らが共同で今年の夏に起こした。彼らは、Metaが彼らの作品を許可なく使用して人工知能言語モデルLlamaのトレーニングを行ったと訴えた。この訴訟は今週、別の同様の訴訟と統合された。 先月、カリフォルニア州の判事はシルバーマン氏の訴訟の一部を却下したが、著者が訴訟を修正することを認めると述べた。新たな苦情には、Meta の研究者が Discord チャット サーバー上でデータセットの入手について話し合っているチャット記録が含まれており、これは Meta が書籍の使用に伴う潜在的な著作権リスクを認識していたことを示す重要な証拠となる可能性がある。チャットログの会話を見ると、海賊版書籍を使用して AI モデルをトレーニングすることの法的リスクについて話し合っていたことがわかる。その中で、Metaの研究者であるティム・デトマーズ氏は、 Metaの法務部門の弁護士が、これらの書籍をAIモデルのトレーニングに使用した場合、法的問題が生じる可能性があると述べたと述べています。弁護士らは、そのデータを使用することはできず、また、たとえ使用されたとしてもそのモデルは公表できないと述べた。 今年、いくつかのテクノロジー企業は、生成AIモデルの構築時に著作権を侵害したとしてコンテンツ制作者から同様の申し立てに直面している。 これらの訴訟が成功すれば、AI モデルの構築コストが増加し、AI 企業がアーティスト、著者、その他のコンテンツ作成者に作品の使用料を支払わざるを得なくなる可能性があり、生成 AI の開発に悪影響を及ぼす可能性があります。 一方、人工知能に関する欧州連合の新たな暫定規則により、企業はモデルのトレーニングに使用するデータを開示するよう強制される可能性があり、より大きな法的リスクにさらされる可能性がある。 Metaは今年2月にLlama大規模言語モデルの最初のバージョンをリリースし、「ThePile」データセットの「Books3」部分を含む、トレーニングに使用されるデータセットのリストを発表しました。訴訟によれば、データセットの作成者は、データセットには196,640冊の本が含まれていると主張した。同社は、今夏に商用ユーザー向けに提供を開始した最新モデル「ラマ2」のトレーニングデータを公開しなかった。 |
>>: 製造業におけるロボット:脅威か、それともチャンスか?
9月22日は秋分の日であり、私の国では3回目の「農民の収穫祭」でもあります。収穫の季節と重なる黄金...
データセンター内外を問わず、自動化に境界はないと考えるのは簡単です。 AI がデータ センターの運用...
少し前に絶賛されたGPT-3を覚えていますか?招待されたユーザーのみがテスト・使用できるもので、史上...
知名度という点では、サウジアラビアのパスポートを持つソフィアは、間違いなくロボット工学界のトップスタ...
[[410588]]この記事はWeChatの公開アカウント「Muscular Coder」から転載し...
数日前、多くのユーザーが GPT-4 が愚かになったと不満を述べていましたが、どれほど愚かになったの...
「文明化された AI」への期待が高まるにつれ、コンサルタントは公平で偏見のないアルゴリズムを作成する...
[[348074]]自動運転車でディープラーニングを使用すると、歩行者の行動を理解したり、最短ルー...
最近、ByteDanceの応用機械学習チームは、veGiantModelという大規模モデルトレーニン...
Volcano Engine は、大規模モデルのトレンドに関する解答用紙を提出しました。大型モデルサ...