7月6日、Googleはプライバシーポリシーを更新し、BardやCloud AIなどのさまざまな人工知能サービスが、Googleがインターネットから収集した公開データを使用してトレーニングされている可能性があることを示唆した。 Googleは月曜日にプライバシーポリシーを更新した。バード、クラウドAI、グーグル翻訳などの人工知能サービスが収集した公開データを使用した可能性があると言及した。 「当社は常にプライバシー ポリシーの透明性を保っており、オープン ウェブからの公開情報を使用して、Google Translate などのサービスの言語モデルをトレーニングしています」と、Google の広報担当者であるクリスタ マルドゥーン氏は述べています。「この最新の更新では、Bard などの新しいサービスも含まれることが明確にされています。当社は、AI 原則に従って、AI 技術の開発にプライバシー原則と安全対策を組み込んでいます。」 2023 年 7 月 1 日に更新された Google のプライバシー ポリシーでは、「Google は、ユーザーと一般の人々に利益をもたらすサービスの改善や新しい製品、機能、テクノロジーの開発のために情報を使用します」と規定されており、同社は「公開されている情報を使用して、Google の人工知能モデルのトレーニングや、Google Translate、Bard、Cloud AI などの製品や機能の開発に役立てる場合があります」とされています。 Google のプライバシー ポリシーの以前の更新からわかるように、Google は今回、収集された公開データを使用してどのサービスがトレーニングされるかについて、より明確にしています。たとえば、Google のプライバシー ポリシーでは、現在、情報は「言語モデル」だけでなく「AI モデル」にも使用される可能性があると明記されており、大規模な言語モデル以外のシステムのトレーニングや開発に公開データを使用する自由が Google に与えられています。しかし、この注意書きは、プライバシーポリシーの「あなたの地域の情報」タブにある「公開されているリソース」への埋め込みリンクの下に埋もれており、ユーザーは関連するコンテンツを見るためにリンクをクリックする必要がある。 更新されたプライバシーポリシーでは、「公開情報」がGoogleの人工知能製品のトレーニングに使用されると記載されているが、Googleが著作権で保護されたコンテンツをトレーニングデータベースに入力することを防ぐかどうか、またどのように防ぐかについては明記されていない。一般に公開されている多くの Web サイトでは、大規模な言語モデルやその他の AI ツールセットをトレーニングする目的でのデータ収集や Web スクレイピングを禁止するポリシーが設けられています。一般データ保護規則 (GDPR) などの規制により、明示的な許可なしにユーザーデータが悪用されるのを防ぐためです。 こうした規制と、ますます競争が激化する市場が相まって、GPT-4 のような主流の生成 AI システムの開発者は、モデルのトレーニングに使用するデータをどこから入手するか、そのデータにソーシャル メディアのコンテンツやアーティストや作家の著作権で保護された作品が含まれているかどうかについて、非常に慎重になっています。 しかし、データの公正利用の原則がこのような AI アプリケーションにまで拡張できるかどうかは、現時点では法的監督のグレーゾーンにあります。こうした不確実性から訴訟が起こり、一部の国ではAI企業がトレーニングデータを収集し使用する方法をより厳しく規制するより厳しい法律を導入するに至った。この不確実性は、このデータをどのように処理し、人工知能システムに高リスクの障害を引き起こさないようにするかなど、さまざまな問題も引き起こします。また、この膨大な量のデータを整理する責任者は、通常、過酷な労働条件で長時間耐えなければなりません。 米国最大の新聞社ガネットは、人工知能技術の進歩により検索大手がデジタル広告市場をさらに独占できるようになったとして、グーグルとその親会社アルファベットを相手取って訴訟を起こした。 Googleのベータ版AI検索などの製品も「模倣エンジン」であると非難され、他のウェブサイトへのトラフィックを枯渇させていると批判されている。 一方、大量の公開情報を含むソーシャルメディアプラットフォームのTwitterとRedditは最近、他社が自社のプラットフォーム上のデータに自由にアクセスするのを防ぐため、抜本的な対策を講じた。しかし、現在の API メカニズムを調整および制限するというプラットフォームの慣行は、Web スクレイピング データに対抗することを目的としたこのような調整がコア ユーザー エクスペリエンスに悪影響を及ぼすため、それぞれのユーザー コミュニティからも強く反対されています。 |
<<: Midjourney モデルとその他の拡散モデルは、ランダム ノイズからどのように画像を生成するのでしょうか?
>>: OpenAI、「超知能」AIを制御するための新チームを発表
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
米パデュー大学の調査によると、OpenAIが開発した人工知能チャットボット「ChatGPT」は、ソフ...
技術の発展に伴い、ドローンの応用シナリオは絶えず拡大しています。ドローンが様々な業界で活用されている...
2020 年は、ディープラーニングベースの自然言語処理 (NLP) 研究にとって忙しい年でした。最...
[[192924]] Pegasystems の調査によると、消費者は人工知能が人間の顧客サービスと...
北京地下鉄は昨年11月から、セキュリティチェックに顔認識技術を使用する試験運用を開始し、ブラックリス...
2019年、中国の人工知能市場は「熱狂的」だった。IDCの統計によると、世界の人工知能市場規模は20...
最近また「AI変顔」が流行っていますね。 Leiphone.com(公式アカウント:Leiphone...
最近、「ネイチャー」誌は表紙に次のような記事を掲載した。「ディープラーニングアルゴリズムを使用して皮...
[[352004]]データ暗号化処理には多くの複雑な暗号化アルゴリズムがあり、これらの暗号化アルゴ...