7月6日、Googleはプライバシーポリシーを更新し、BardやCloud AIなどのさまざまな人工知能サービスが、Googleがインターネットから収集した公開データを使用してトレーニングされている可能性があることを示唆した。 Googleは月曜日にプライバシーポリシーを更新した。バード、クラウドAI、グーグル翻訳などの人工知能サービスが収集した公開データを使用した可能性があると言及した。 「当社は常にプライバシー ポリシーの透明性を保っており、オープン ウェブからの公開情報を使用して、Google Translate などのサービスの言語モデルをトレーニングしています」と、Google の広報担当者であるクリスタ マルドゥーン氏は述べています。「この最新の更新では、Bard などの新しいサービスも含まれることが明確にされています。当社は、AI 原則に従って、AI 技術の開発にプライバシー原則と安全対策を組み込んでいます。」 2023 年 7 月 1 日に更新された Google のプライバシー ポリシーでは、「Google は、ユーザーと一般の人々に利益をもたらすサービスの改善や新しい製品、機能、テクノロジーの開発のために情報を使用します」と規定されており、同社は「公開されている情報を使用して、Google の人工知能モデルのトレーニングや、Google Translate、Bard、Cloud AI などの製品や機能の開発に役立てる場合があります」とされています。 Google のプライバシー ポリシーの以前の更新からわかるように、Google は今回、収集された公開データを使用してどのサービスがトレーニングされるかについて、より明確にしています。たとえば、Google のプライバシー ポリシーでは、現在、情報は「言語モデル」だけでなく「AI モデル」にも使用される可能性があると明記されており、大規模な言語モデル以外のシステムのトレーニングや開発に公開データを使用する自由が Google に与えられています。しかし、この注意書きは、プライバシーポリシーの「あなたの地域の情報」タブにある「公開されているリソース」への埋め込みリンクの下に埋もれており、ユーザーは関連するコンテンツを見るためにリンクをクリックする必要がある。 更新されたプライバシーポリシーでは、「公開情報」がGoogleの人工知能製品のトレーニングに使用されると記載されているが、Googleが著作権で保護されたコンテンツをトレーニングデータベースに入力することを防ぐかどうか、またどのように防ぐかについては明記されていない。一般に公開されている多くの Web サイトでは、大規模な言語モデルやその他の AI ツールセットをトレーニングする目的でのデータ収集や Web スクレイピングを禁止するポリシーが設けられています。一般データ保護規則 (GDPR) などの規制により、明示的な許可なしにユーザーデータが悪用されるのを防ぐためです。 こうした規制と、ますます競争が激化する市場が相まって、GPT-4 のような主流の生成 AI システムの開発者は、モデルのトレーニングに使用するデータをどこから入手するか、そのデータにソーシャル メディアのコンテンツやアーティストや作家の著作権で保護された作品が含まれているかどうかについて、非常に慎重になっています。 しかし、データの公正利用の原則がこのような AI アプリケーションにまで拡張できるかどうかは、現時点では法的監督のグレーゾーンにあります。こうした不確実性から訴訟が起こり、一部の国ではAI企業がトレーニングデータを収集し使用する方法をより厳しく規制するより厳しい法律を導入するに至った。この不確実性は、このデータをどのように処理し、人工知能システムに高リスクの障害を引き起こさないようにするかなど、さまざまな問題も引き起こします。また、この膨大な量のデータを整理する責任者は、通常、過酷な労働条件で長時間耐えなければなりません。 米国最大の新聞社ガネットは、人工知能技術の進歩により検索大手がデジタル広告市場をさらに独占できるようになったとして、グーグルとその親会社アルファベットを相手取って訴訟を起こした。 Googleのベータ版AI検索などの製品も「模倣エンジン」であると非難され、他のウェブサイトへのトラフィックを枯渇させていると批判されている。 一方、大量の公開情報を含むソーシャルメディアプラットフォームのTwitterとRedditは最近、他社が自社のプラットフォーム上のデータに自由にアクセスするのを防ぐため、抜本的な対策を講じた。しかし、現在の API メカニズムを調整および制限するというプラットフォームの慣行は、Web スクレイピング データに対抗することを目的としたこのような調整がコア ユーザー エクスペリエンスに悪影響を及ぼすため、それぞれのユーザー コミュニティからも強く反対されています。 |
<<: Midjourney モデルとその他の拡散モデルは、ランダム ノイズからどのように画像を生成するのでしょうか?
>>: OpenAI、「超知能」AIを制御するための新チームを発表
[[434663]]序文LeetCode を練習していると、スライディング ウィンドウ タイプの問題...
[[436983]]キーポイント推定は、画像内の関心ポイントを特定するコンピューター ビジョン タ...
データが組織の生命線となっている今日のデジタル時代では、サイバーセキュリティが極めて重要になっていま...
K 最近傍アルゴリズム、K-NN とも呼ばれます。今日のディープラーニングの時代では、この古典的な機...
西オーストラリア大学の研究者らは、交通渋滞を緩和するために設計された無人運転車が逆の効果をもたらして...
ロボットが社会を変える出発点は、旅行の分野にあるかもしれない。 1956 年、ジョン・マッカーシーは...
[[182024]]これは Wolfgang Beyer によるブログ投稿です。この論文では、Te...
AI チャットボットは、自然言語処理と機械学習を使用してユーザーとの人間の会話をシミュレートするソフ...
2023年は大きな言語モデルと着実な普及の年です。時系列の分野ではそれほど大きな成果は得られていませ...
機械は損失関数を通じて学習します。これは、特定のアルゴリズムが与えられたデータをどれだけ適切にモデル...
この記事はeasyAI - 人工知能ナレッジベースから転送されました目次人工知能に関する誤解人工知能...