Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

今後、インターネット上で公に話すすべての言葉が、Google によって AI のトレーニングに使用される可能性があります。

そうです、絵を描いた後は、テキストワークも大きなモデルに送り込むことになります——

技術的なブログ、コード、論文など、オンラインで公開するあらゆるものは、著作権で保護されている場合でも、「Google Big Model Blender」に投入できます。

今週、Google はプライバシーポリシーを更新し、AI ツールの構築のためにインターネット上のすべての公開コンテンツをクロールする権利を留保していることを明確にしました。

ネットユーザーたちはすぐに衝撃を受けた。「Google はあらゆるものをクロールしている」と警告する人もいます。

Google があなたの書いたものを読むと、それは Google のものになります。

写真

ネットユーザーの中には、より悲観的な見方をする人もいる。

近い将来、すべてのコンテンツ制作者は AI になるでしょう。

写真

それで、このプライバシーポリシーとは何でしょうか?

BardなどのAI製品のトレーニングに使用

話は最近Googleが更新したプライバシーポリシーから始まります。

Googleは最新のプライバシーポリシーに、「研究開発」のためのAIモデルに関する条項を追加した。

Google は、ユーザーと一般の人々の利益のために、サービスの向上や新しい製品、機能、技術の開発のために情報を使用します。
たとえば、Google は公開されている情報を活用して、Google の AI モデルのトレーニングや、便利な製品や機能（Google 翻訳、Bard、Cloud AI 機能など）の構築に役立てています。

つまり、収集される可能性のあるすべての公開情報は、Google 翻訳、Bard、Cloud AI などの AI 関連製品や機能のトレーニングに使用されます。

写真

では、この公開情報には具体的に何が含まれるのでしょうか?

たとえば、検索キーワード、Google サービスとやり取りするアプリやブラウザに関する情報、サードパーティのサイトやアプリでの Google サービスの使用など、インターネット、ネットワーク、その他のアクティビティ情報などです。

つまり、以前に公開されたブログコンテンツだけでなく、オンラインで公開された Google ドキュメントや個人情報を含む投稿も、大規模なモデルのトレーニングのために Google によって収集される可能性があります。

もちろん、現時点ではこれらの内容はまだ「公開情報」に限られています。

Google が提供する Gmail などの電子メールサービスは、データにクロールされるべきではありません。

さらに、Google はプライバシーポリシーで、セキュリティ上の脅威の防止、情報の確認、サービスのメンテナンス、パーソナライズされた広告、法的理由など、他の目的にもこの個人情報や公開情報を使用する可能性があることも明記しています。

しかし、なぜ Google はこの重要な時期にこのポリシーを更新したのでしょうか?

「AIはテキストの著作権に挑戦している」

おそらく、RedditやTwitterなどの企業が実施している「フロー制限」作戦にも関係しているのだろう。

まず、今年4月にRedditは、APIへのアクセスに対して企業に料金を請求し始めると発表しました。

同社のCEOはRedditのデータベースは価値があると考えているが、この貴重なコンテンツを大手テクノロジー企業に無料で提供することは望んでいない。

その後、Twitterも「AI企業がデータを無料で入手することを望まない」という理由でTwitterの流入を制限し始めた。未認証ユーザーの1日のページビューはわずか600だったが、認証後は6,000に増加した。

この一連のポリシーは、ユーザーとサードパーティのツールに深刻な影響を及ぼしています。たとえば、Redditはディスカッションフォーラムで大規模な抗議を引き起こしました。多くのモデレーターは、Redditの活動に抗議するために、フォーラムを直接閉鎖しました。Twitterでも多くの人々がこれを非難し、一部のネットユーザーは「Twitterは殺された」とさえ言っています。

しかし、何があっても、AI がデータを無料で取得できるようにするというのは、無視できない矛盾となってきました。

一部のネットユーザーは、Google AIによるデータのクロールについて疑問を呈している。

検索エンジンなどインターネットでもデータのクローリングといった業務があったのに、なぜ「AIクローリング」に人々は抵抗感を持つのでしょうか。

写真

一部のネットユーザーは次のように反応した。

それは本質的に著作権の問題です。著作権で保護された素材を単に引用しているだけであれば、必ずしも著作権を侵害しているわけではありません。しかし、AI を使用して著作権で保護されたコンテンツを「かき混ぜてクリーンにする」ことが合法となると、著作権は実質的に消滅します。

写真

だからこそ、彼はこの件に関して悲観的である。

誰かがあなたのブログ投稿を出典を明記せずにコピーしたり、あなたのオープンソースコードを有料サービスに使用したり、StackOverflow でのあなたの回答を質問への回答方法として使用したりしても構いませんか?
これまでやってきたことはすべて無料でした。しかし今、AIが私を消えてほしいと望むなら、私は消えます。

写真

もちろん、一部のネットユーザーはすでにこの政策の導入を受け入れており、各自の予防意識が不可欠であると警告している。