ロイター通信は12月13日、著作権侵害訴訟の新たな文書によると、メタ・プラットフォームズは何千冊もの海賊版書籍を使ってAIモデルを訓練することには法的リスクがあることを知っていたにもかかわらず、それでもそうすることを主張していたと報じた。 IT Homeによると、この訴訟はコメディアンのサラ・シルバーマン、ピューリッツァー賞受賞者のマイケル・シェイボン、その他の有名作家らが共同で今年の夏に起こした。彼らは、Metaが彼らの作品を許可なく使用して人工知能言語モデルLlamaのトレーニングを行ったと訴えた。この訴訟は今週、別の同様の訴訟と統合された。 先月、カリフォルニア州の判事はシルバーマン氏の訴訟の一部を却下したが、著者が訴訟を修正することを認めると述べた。新たな苦情には、Meta の研究者が Discord チャット サーバー上でデータセットの入手について話し合っているチャット記録が含まれており、これは Meta が書籍の使用に伴う潜在的な著作権リスクを認識していたことを示す重要な証拠となる可能性がある。チャットログの会話を見ると、海賊版書籍を使用して AI モデルをトレーニングすることの法的リスクについて話し合っていたことがわかる。その中で、Metaの研究者であるティム・デトマーズ氏は、 Metaの法務部門の弁護士が、これらの書籍をAIモデルのトレーニングに使用した場合、法的問題が生じる可能性があると述べたと述べています。弁護士らは、そのデータを使用することはできず、また、たとえ使用されたとしてもそのモデルは公表できないと述べた。 今年、いくつかのテクノロジー企業は、生成AIモデルの構築時に著作権を侵害したとしてコンテンツ制作者から同様の申し立てに直面している。 これらの訴訟が成功すれば、AI モデルの構築コストが増加し、AI 企業がアーティスト、著者、その他のコンテンツ作成者に作品の使用料を支払わざるを得なくなる可能性があり、生成 AI の開発に悪影響を及ぼす可能性があります。 一方、人工知能に関する欧州連合の新たな暫定規則により、企業はモデルのトレーニングに使用するデータを開示するよう強制される可能性があり、より大きな法的リスクにさらされる可能性がある。 Metaは今年2月にLlama大規模言語モデルの最初のバージョンをリリースし、「ThePile」データセットの「Books3」部分を含む、トレーニングに使用されるデータセットのリストを発表しました。訴訟によれば、データセットの作成者は、データセットには196,640冊の本が含まれていると主張した。同社は、今夏に商用ユーザー向けに提供を開始した最新モデル「ラマ2」のトレーニングデータを公開しなかった。 |
>>: 製造業におけるロボット:脅威か、それともチャンスか?
人工知能の開発は、最も急速に成長している技術分野の 1 つです。 Apple、Google、Sams...
[51CTO.com からのオリジナル記事] 人類が初めてプログラム可能なコンピューターを思いついた...
数十年前、技術者が初めて人工知能の概念を生み出したとき、彼らは人間の知能を模倣できる技術を生み出そう...
販売業界が進化し続けるにつれて、販売チームが新規顧客を引き付け、既存顧客を維持するのに役立つ販売戦略...
[[429712]]この記事はWeChatの公開アカウント「3分でフロントエンドを学ぶ」から転載した...
2020年、「人工知能」は産業発展における高頻度のホットワードとなり、市場展望は業界全体で広く認知さ...
ポッドキャスティングは、よりカジュアルな形式のオーディオストーリーテリングへと進化しています。複雑な...
著者: Yong Hao Gen Gen、Wang Xin など1 はじめに美団の総合店内事業(以下...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...