OpenAI: 著作権のあるコンテンツを使用しないと、ChatGPTのようなAIモデルを開発することはできない

OpenAI: 著作権のあるコンテンツを使用しないと、ChatGPTのようなAIモデルを開発することはできない

IT Homeは1月10日、ChatGPTの開発元であるOpenAIが最近、ChatGPTのようなAIツールの開発は著作権で保護された素材と切り離せないものであることを認め、これらの素材がなければこれらのツールは生まれなかっただろうと述べたと報じた。デイリー・テレグラフによると、OpenAIは英国貴族院通信・デジタル問題特別委員会の大規模言語モデルに関する調査に提出した文書の中でこの声明を発表した。

ChatGPTや画像ジェネレーターDALL-EなどのAIモデルが強力なのは、膨大な量のコンテンツでトレーニングされているからである。そのコンテンツの一部はインターネット上で公開されているコンテンツから収集されており、必ずしも著作権者の許可を得ているわけではない(OpenAIはトレーニングコンテンツの一部にライセンスを与えている)。この「自由な」クローリング手法は、学術的な機械学習研究において長い歴史がありますが、最近、ディープラーニング AI モデルが商用化されるにつれて、厳しい監視を受けるようになりました。

「現在、著作権はブログ投稿、写真、フォーラム投稿、ソフトウェアコードの一部、政府文書など、人間の表現のほぼすべてをカバーしているため、著作権で保護されたコンテンツを使用せずに今日の主要なAIモデルをトレーニングすることは不可能だ」とOpenAIは貴族院への提出書類で述べた。

OpenAIはさらに、トレーニングデータが「1世紀前の」パブリックドメインの書籍や図面に限定されている場合、「現代の市民のニーズを満たす」AIシステムをトレーニングすることは不可能であると述べた。

IT Homeは、昨年12月にニューヨーク・タイムズがOpenAIとOpenAIの主要投資家であるマイクロソフトを相手取り、同紙のコンテンツを自社製品で許可なく違法に使用したとして訴訟を起こしたことを報じた。 OpenAIは月曜日に自社のウェブサイトでこの訴訟に反応し、訴訟には根拠がないとし、ジャーナリズムと報道機関との提携に対する支持を改めて表明した。

OpenAIの抗弁は主に「フェアユース」という法理に基づいており、これは特定の状況下で著作権者の許可なく著作権で保護されたコンテンツを限定的に使用することを許可するものだ。同社は、著作権法ではそのような素材をAIモデルのトレーニングに使用することを禁止していないと主張している。

「AIモデルのトレーニングにインターネット上で公開されている素材を使うのはフェアユースだという見解は、長年にわたり広く受け入れられてきた前例によって裏付けられている」とOpenAIは月曜日に公開したブログ記事に記した。「この原則はクリエイターにとってフェアであり、イノベーターにとって必要であり、アメリカの競争力にとって極めて重要であると私たちは信じている」

OpenAIがAIトレーニングデータに関してフェアユースの抗弁を主張したのは今回が初めてではない。 8月には、OpenAIはコメディアンのサラ・シルバーマンによる著作権訴訟に対して、フェアユースを理由に公開素材の使用を擁護した。 OpenAIは、このコメディアンが著作権の範囲を「誤解」しており、大規模言語モデルのような最先端のAIイノベーションが発展するために必要な余地を残す「公正使用」などの制限や例外を考慮に入れていなかったと主張した。

<<:  マルチモーダル LLM を自動運転の意思決定者として使用すると、説明可能になります。 SenseTimeの特別なシナリオの純粋なエンドツーエンド処理よりも優れています

>>:  コードコーパス、大規模モデル、インテリジェントエージェントの魔法の杖を振ると、より強力なエネルギーが呼び出されます

ブログ    
ブログ    

推薦する

8 クイーン問題を解く C# アルゴリズムの簡単な分析

8つのクイーンの問題の説明: 8 クイーン問題は古くからある有名な問題であり、バックトラッキング ア...

...

ビットコインマイニング技術: 分散データストレージ、ピアツーピア伝送、コンセンサスメカニズム、暗号化アルゴリズム...

1. 説明ブロックチェーンは、オープンなデータ操作、改ざん不可能、追跡可能性、国境を越えた分散化な...

OpenAI COO: AIが一夜にしてビジネスに大きな変化をもたらすとは期待しない

12月5日、OpenAIは企業ユーザーの開拓に力を入れているものの、同社の幹部の一部は、この技術がす...

ディープラーニングで構造化データを処理するにはどうすればよいですか?

この投稿では、ディープラーニングのあまり知られていない応用分野である構造化データに焦点を当てます。こ...

2019年インターネット人材採用レポート:Javaは人気だが、アルゴリズムエンジニアは不足している

技術の変化、才能主導。インターネットにおける現在の仕事の機会とトレンドはどこにありますか?本稿では、...

...

Transformerの本質的欠陥を解決する:復旦大学らが提案した線形複雑性SOFT

[[437909]] Visual Transformer (ViT) は、パッチ単位の画像トーク...

ガートナー:持続可能性とデジタル主権がパブリッククラウドベースのAIサービスを選択する際の最重要基準となる

ガートナーは、2027 年までに、生成型人工知能 (生成型 AI) を導入する企業の 70% が、持...

中国のこの場所で:人工知能の新たな革命が起こる - 中国におけるAIの現状分析

中国はなぜ米国と同じくらい多くの人工知能研究者を育成しているにもかかわらず、機械学習などの主要分野で...

マイクロソフト、ヘルスケア業界がデータの価値を解き放つための新しい AI ソリューションをリリース

ヘルスケア業界とそのサービス技術が急速に発展するにつれて、大量のデータと情報が生成されます。統計レポ...

人工知能の時代では、科学技術分野の人材は職を失うのでしょうか?

インターネット技術の発展、ビッグデータや人工知能技術の進歩により、一部の伝統的な産業は革命的な変化を...

...

AIは数分間の記録に基づいて、人がCOVID-19に感染したかどうかを判断できますか?

今日の若者は、「エモ」という言葉をキャッチフレーズとして使うことに慣れているが、本当の「うつ病」が何...