Googleはプライバシーポリシーを更新し、インターネット上の公開データをAIの訓練に利用していることを明確にした。

Googleはプライバシーポリシーを更新し、インターネット上の公開データをAIの訓練に利用していることを明確にした。

7月6日、Googleはプライバシーポリシーを更新し、BardやCloud AIなどのさまざまな人工知能サービスが、Googleがインターネットから収集した公開データを使用してトレーニングされている可能性があることを示唆した。

Googleは月曜日にプライバシーポリシーを更新した。バード、クラウドAI、グーグル翻訳などの人工知能サービスが収集した公開データを使用した可能性があると言及した。

「当社は常にプライバシー ポリシーの透明性を保っており、オープン ウェブからの公開情報を使用して、Google Translate などのサービスの言語モデルをトレーニングしています」と、Google の広報担当者であるクリスタ マルドゥーン氏は述べています。「この最新の更新では、Bard などの新しいサービスも含まれることが明確にされています。当社は、AI 原則に従って、AI 技術の開発にプライバシー原則と安全対策を組み込んでいます。」

2023 年 7 月 1 日に更新された Google のプライバシー ポリシーでは、「Google は、ユーザーと一般の人々に利益をもたらすサービスの改善や新しい製品、機能、テクノロジーの開発のために情報を使用します」と規定されており、同社は「公開されている情報を使用して、Google の人工知能モデルのトレーニングや、Google Translate、Bard、Cloud AI などの製品や機能の開発に役立てる場合があります」とされています。

Google のプライバシー ポリシーの以前の更新からわかるように、Google は今回、収集された公開データを使用してどのサービスがトレーニングされるかについて、より明確にしています。たとえば、Google のプライバシー ポリシーでは、現在、情報は「言語モデル」だけでなく「AI モデル」にも使用される可能性があると明記されており、大規模な言語モデル以外のシステムのトレーニングや開発に公開データを使用する自由が Google に与えられています。しかし、この注意書きは、プライバシーポリシーの「あなたの地域の情報」タブにある「公開されているリソース」への埋め込みリンクの下に埋もれており、ユーザーは関連するコンテンツを見るためにリンクをクリックする必要がある。

更新されたプライバシーポリシーでは、「公開情報」がGoogleの人工知能製品のトレーニングに使用されると記載されているが、Googleが著作権で保護されたコンテンツをトレーニングデータベースに入力することを防ぐかどうか、またどのように防ぐかについては明記されていない。一般に公開されている多くの Web サイトでは、大規模な言語モデルやその他の AI ツールセットをトレーニングする目的でのデータ収集や Web スクレイピングを禁止するポリシーが設けられています。一般データ保護規則 (GDPR) などの規制により、明示的な許可なしにユーザーデータが悪用されるのを防ぐためです。

こうした規制と、ますます競争が激化する市場が相まって、GPT-4 のような主流の生成 AI システムの開発者は、モデルのトレーニングに使用するデータをどこから入手するか、そのデータにソーシャル メディアのコンテンツやアーティストや作家の著作権で保護された作品が含まれているかどうかについて、非常に慎重になっています。

しかし、データの公正利用の原則がこのような AI アプリケーションにまで拡張できるかどうかは、現時点では法的監督のグレーゾーンにあります。こうした不確実性から訴訟が起こり、一部の国ではAI企業がトレーニングデータを収集し使用する方法をより厳しく規制するより厳しい法律を導入するに至った。この不確実性は、このデータをどのように処理し、人工知能システムに高リスクの障害を引き起こさないようにするかなど、さまざまな問題も引き起こします。また、この膨大な量のデータを整理する責任者は、通常、過酷な労働条件で長時間耐えなければなりません。

米国最大の新聞社ガネットは、人工知能技術の進歩により検索大手がデジタル広告市場をさらに独占できるようになったとして、グーグルとその親会社アルファベットを相手取って訴訟を起こした。 Googleのベータ版AI検索などの製品も「模倣エンジン」であると非難され、他のウェブサイトへのトラフィックを枯渇させていると批判されている。

一方、大量の公開情報を含むソーシャルメディアプラットフォームのTwitterとRedditは最近、他社が自社のプラットフォーム上のデータに自由にアクセスするのを防ぐため、抜本的な対策を講じた。しかし、現在の API メカニズムを調整および制限するというプラットフォームの慣行は、Web スクレイピング データに対抗することを目的としたこのような調整がコア ユーザー エクスペリエンスに悪影響を及ぼすため、それぞれのユーザー コミュニティからも強く反対されています。

<<:  Midjourney モデルとその他の拡散モデルは、ランダム ノイズからどのように画像を生成するのでしょうか?

>>:  OpenAI、「超知能」AIを制御するための新チームを発表

推薦する

OpenAI API 高度な関数呼び出し実装プラグイン!

関数呼び出しの紹介関数呼び出しとは何ですか? OpenAI Chat API公式ドキュメント: Ch...

北京航空航天大学はモードの壁を打ち破り、可視光と赤外線モードにわたる普遍的な物理的対抗手段を開発しました。

近年、視覚システムのセキュリティ評価の研究が徐々に深まっています。研究者は、メガネ、ステッカー、衣服...

...

科学技術省はAIの使用を規制し、AIGCが申請資料を直接生成することを禁止する文書を発行した。

IT Homeは1月3日、科学技術部監督管理部門が先月「責任ある研究行為に関するガイドライン(20...

なぜ人工知能は過大評価されているのでしょうか?

他の新しいテクノロジーと同様に、AI もハイプ サイクルと呼ばれる段階を経ます。それらはテクノロジー...

スーパー人工知能とは何ですか?

進化し続けるテクノロジーの世界において、魅力的であると同時に不安も抱かせる概念の出現が、スーパー人工...

Gluon は AI 開発者に自己調整型機械学習をもたらします

概要: Microsoft と Amazon の共同作業により、MXNet と Microsoft ...

Zhihu の Bridge Platform は、ビジネス機能を強化するコンテンツ運用プラットフォームをどのように構築するのでしょうか?

1. キーワードZhihu、Bridge、コンテンツ プール、コンテンツ管理プラットフォーム、コン...

AIは教育の問題を解決できないが、メンターツールにはなり得る

今、これまで以上に、教師たちは助けを必要としています。数週間のうちにすべての授業をオンラインに移行す...

...

大規模自動運転モデル​​に関する研究と論文の簡単な説明

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

機械学習アルゴリズムが NDA の法的分析テストで 20 人の弁護士に勝利

ロボット工学と人工知能の発展により、多くの仕事が機械に置き換えられるでしょう。機械は、一部のタスク、...

プライバシー保護を再構築するには、AIモデルに「あなたを忘れさせる」ことを早く行う必要がある

この時代において、プライバシーは長い間誤った主張となってきました。プライバシー保護をある程度回復する...

人工知能は今年のトップ10の新興職業の中で第1位にランクイン

どの企業もある程度はテクノロジーを取り入れる必要があったため、こうした急成長の仕事にもその傾向が反映...

...