Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

Google AI はすべてを食べています!すべての公開コンテンツはAIトレーニングのためにクロールされ、プライバシーポリシーが更新されました

今後、インターネット上で公に話すすべての言葉が、Google によって AI のトレーニングに使用される可能性があります。

そうです、絵を描いた後は、テキストワークも大きなモデルに送り込むことになります——

技術的なブログ、コード、論文など、オンラインで公開するあらゆるものは、著作権で保護されている場合でも、「Google Big Model Blender」に投入できます。

今週、Google はプライバシー ポリシーを更新し、AI ツールの構築のためにインターネット上のすべての公開コンテンツをクロールする権利を留保していることを明確にしました。

ネットユーザーたちはすぐに衝撃を受けた。 「Google はあらゆるものをクロールしている」と警告する人もいます。

Google があなたの書いたものを読むと、それは Google のものになります。

写真

ネットユーザーの中には、より悲観的な見方をする人もいる。

近い将来、すべてのコンテンツ制作者は AI になるでしょう。

写真

それで、このプライバシーポリシーとは何でしょうか?

BardなどのAI製品のトレーニングに使用

話は最近Googleが更新したプライバシーポリシーから始まります。

Googleは最新のプライバシーポリシーに、「研究開発」のためのAIモデルに関する条項を追加した。

Google は、ユーザーと一般の人々の利益のために、サービスの向上や新しい製品、機能、技術の開発のために情報を使用します。

たとえば、Google は公開されている情報を活用して、Google の AI モデルのトレーニングや、便利な製品や機能(Google 翻訳、Bard、Cloud AI 機能など)の構築に役立てています。

つまり、収集される可能性のあるすべての公開情報は、Google 翻訳、Bard、Cloud AI などの AI 関連製品や機能のトレーニングに使用されます。

写真

では、この公開情報には具体的に何が含まれるのでしょうか?

たとえば、検索キーワード、Google サービスとやり取りするアプリやブラウザに関する情報、サードパーティのサイトやアプリでの Google サービスの使用など、インターネット、ネットワーク、その他のアクティビティ情報などです。

つまり、以前に公開されたブログコンテンツだけでなく、オンラインで公開された Google ドキュメントや個人情報を含む投稿も、大規模なモデルのトレーニングのために Google によって収集される可能性があります。

もちろん、現時点ではこれらの内容はまだ「公開情報」に限られています。

Google が提供する Gmail などの電子メール サービスは、データにクロールされるべきではありません。

さらに、Google はプライバシー ポリシーで、セキュリティ上の脅威の防止、情報の確認、サービスのメンテナンス、パーソナライズされた広告、法的理由など、他の目的にもこの個人情報や公開情報を使用する可能性があることも明記しています。

しかし、なぜ Google はこの重要な時期にこのポリシーを更新したのでしょうか?

「AIはテキストの著作権に挑戦している」

おそらく、RedditやTwitterなどの企業が実施している「フロー制限」作戦にも関係しているのだろう。

まず、今年4月にRedditは、APIへのアクセスに対して企業に料金を請求し始めると発表しました。

同社のCEOはRedditのデータベースは価値があると考えているが、この貴重なコンテンツを大手テクノロジー企業に無料で提供することは望んでいない。

その後、Twitterも「AI企業がデータを無料で入手することを望まない」という理由でTwitterの流入を制限し始めた。未認証ユーザーの1日のページビューはわずか600だったが、認証後は6,000に増加した。

この一連のポリシーは、ユーザーとサードパーティのツールに深刻な影響を及ぼしています。たとえば、Redditはディスカッションフォーラムで大規模な抗議を引き起こしました。多くのモデレーターは、R​​edditの活動に抗議するために、フォーラムを直接閉鎖しました。Twitterでも多くの人々がこれを非難し、一部のネットユーザーは「Twitterは殺された」とさえ言っています。

しかし、何があっても、AI がデータを無料で取得できるようにするというのは、無視できない矛盾となってきました。

一部のネットユーザーは、Google AIによるデータのクロールについて疑問を呈している。

検索エンジンなどインターネットでもデータのクローリングといった業務があったのに、なぜ「AIクローリング」に人々は抵抗感を持つのでしょうか。

写真

一部のネットユーザーは次のように反応した。

それは本質的に著作権の問題です。著作権で保護された素材を単に引用しているだけであれば、必ずしも著作権を侵害しているわけではありません。しかし、AI を使用して著作権で保護されたコンテンツを「かき混ぜてクリーンにする」ことが合法となると、著作権は実質的に消滅します。

写真

だからこそ、彼はこの件に関して悲観的である。

誰かがあなたのブログ投稿を出典を明記せずにコピーしたり、あなたのオープンソース コードを有料サービスに使用したり、StackOverflow でのあなたの回答を質問への回答方法として使用したりしても構いませんか?

これまでやってきたことはすべて無料でした。しかし今、AIが私を消えてほしいと望むなら、私は消えます。

写真

もちろん、一部のネットユーザーはすでにこの政策の導入を受け入れており、各自の予防意識が不可欠であると警告している。

新しいポリシーを注意深く読み、オンラインで漏洩している情報の量に注意してください。

写真

それで、これについてどう思いますか?

参考リンク:

[1] https://gizmodo.com/google-says-it’ll-scrape-everything-you-post-online-for-1850601486
[2] https://news.ycombinator.com/item?id=36577626

<<:  AIサークルが爆発した!マイクロソフトがトランスフォーマーのブロックを解除、シーケンスの長さが10億以上に拡大

>>:  中国科学院とアリババが開発したFF3Dでは、カスタムスタイルの3Dポートレートを作成するのにわずか3分しかかかりません。

ブログ    
ブログ    
ブログ    

推薦する

ついに誰かが「組み込み人工知能」を明らかにした

組み込み人工知能とは、組み込み環境で人工知能を実行することです。アルゴリズムモデルは以前と同じですが...

Google、人工知能をより有効活用できるよう複数のAIツールをリリース

Google は今週開催された Cloud Next カンファレンスで、さまざまな機械学習ツール、顧...

NVIDIA の最も強力な汎用大型モデル Nemotron-4 が登場! 15Bが62Bに勝ち、ターゲットはA100/H100です。

最近、NVIDIA チームは、8T トークンでトレーニングされた 150 億のパラメータを持つ新しい...

科学者らが自己再生材料に使える3Dプリント「生きたインク」を開発

[[437285]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

...

エネルギー分野における人工知能の5つの主要な応用

[[435080]]エネルギー分野における AI の革新と進歩により、企業がエネルギーを生産、販売、...

新しいアルゴリズムによりクラウドデータベースのパフォーマンスが向上

Gigaom の Jordan Novet 氏の報告によると、MIT の研究者らは DBSeer と...

企業はビッグデータ アルゴリズムを使用して効果的なリンクを構築できますか?

ビッグデータは人々にとって巨大な概念であるようです。しかし、多くの企業がすでに業務にビッグデータを活...

...

...

テルアビブ大学は、SOTAメソッドとアーキテクチャの新たな進歩を完全に理解するためにStyleGANを要約しました。

GAN の高解像度画像を生成する能力は、画像合成および処理の分野に革命をもたらしています。 201...

Google が新モデル EfficientNet をオープンソース化: 画像認識効率が 10 倍に向上、パラメータが 88% 削減

畳み込みニューラル ネットワークは通常、限られたリソースで開発され、その後、条件が許せば、より高い精...

...

GenAI が CIO にとって悪夢である理由とその解決方法

GenAI が現代の企業にとって非常に魅力的な理由は理解できます。これは、世界中のさまざまな業界で無...

人工知能はビジネス開発にどのような影響を与えるのでしょうか?

[[403654]]人工知能はイノベーションを推進し、ビジネス開発を変えています。人工知能と機械学...