AIは中国のインターネットを狂ったように汚染している

AIは中国のインターネットを汚染する「犯人」の1つとなった。

問題はこれです。

最近、誰もが AI に相談することに熱心です。あるネットユーザーが Bing に次のような質問をしました。

エレファント・トランク・ヒルにはケーブルカーはありますか？

Bing もすべての質問に答え、信頼できると思われる回答を返しました。

肯定的な回答をした後、Bing はチケットの価格や営業時間などの詳細な情報も親切に提供してくれました。

しかし、ネットユーザーは答えをそのまま受け入れず、ヒントに従って下の「参考リンク」をクリックした。

この時点で、ネットユーザーは何かがおかしいことに気づいた。なぜこの人の答えはそんなに「奇妙」なのか？

そこで彼は「百变人生」というユーザーのホームページをクリックし、このユーザーがAIであることに突然気づいたのです。

このユーザーは質問に非常に速く回答するため、ほぼ 1 ～ 2 分ごとに質問を終えることができます。

1分以内に2つの質問に答えることもできます。

注意深く観察した結果、このネットユーザーはこれらの回答の内容が検証されていないことを発見しました...

そして彼は、これが Bing が間違った回答を出力する原因であると考えています。

このAIは中国のインターネットをひどく汚染しています。

AI汚染の原因は1つではない

では、ネットユーザーによって発見されたこの AI ユーザーに今何が起こっているのでしょうか?

現状の結果から判断すると、彼は知虎によって「沈黙の刑」を宣告されたことになる。

しかし、それにもかかわらず、他のネットユーザーは率直にこう述べた。

1つ以上。

Zhihu の「回答を待っています」列をクリックし、質問をランダムに選択して下にスクロールすると、確かに多くの「機械語」回答が表示されます。

例えば、「生活における AI の応用シナリオは何ですか?」という質問に対する答えの中に、1 つの答えが見つかりました。

回答の言語が「機械語」であるだけでなく、回答には「AI支援による作成を含む」というラベルが直接付けられています。

そして、ChatGPT に質問を投げかけると、返ってくる答えは... まあ、ほとんど同じ古い話です。

実は、こうした「AI汚染源」はこのプラットフォームに限定されるものではありません。

単純な科学イラストであっても、AI は何度も間違いを犯します。

これを読んでネットユーザーも感動した。「わあ、川貝の写真が1枚もない」

AIによって生成されたさまざまな種類のフェイクニュースも一般的です。

例えば、少し前にインターネット上でセンセーショナルなニュースが広まりました。タイトルは「鄭州のチキンステーキ店で流血事件発生。男性が女性をレンガで殴り殺す！」でした。》。

しかし実際には、このニュースは江西省の陳という男性がChatGPTを使用してファンとトラフィックを集めて生成したものです。

偶然にも、広東省深セン市の洪穆迪氏もAI技術を使ってフェイクニュースを発信した。「今朝、甘粛省で列車が道路建設作業員に衝突し、9人が死亡した。」

具体的には、近年話題になっているソーシャルニュースをインターネット全体で検索し、AIソフトウェアを使ってニュースの時間や場所などを修正・編集し、特定のプラットフォームで注目度やトラフィックを獲得して不法な利益を得ていた。

警察は彼らに対して刑事強制措置を講じた。

しかし、実はこの「AI汚染源」という現象は中国だけでなく、海外にも存在している。

プログラマーの Q&A コミュニティである Stack Overflow がその一例です。

ChatGPT が人気になり始めた昨年末、Stack Overflow は突然「一時的な禁止」を発表しました。

当時発表された公式の理由は次の通りです。

目的は、ChatGPT を使用して作成された回答がコミュニティに流入するのを遅らせることです。
ChatGPT から間違った回答が返ってくる確率が高すぎるからです。

Stack Overflow ではこの現象についてさらに詳しく説明しています。

以前のユーザーが回答した質問は、専門知識を持つ他のユーザーによって閲覧され、正しい回答または誤った回答が与えられ、検証に相当すると考えています。

しかし、ChatGPTの登場以来、「非常に正しい」と感じられる回答が多数登場しています。ただし、専門知識の背景を持つユーザーの数は限られており、生成された回答をすべて読むことは不可能です。

さらに、ChatGPT はこれらの専門的な質問に答えますが、そのエラー率は現実的であるため、Stack Overflow はこれを無効にすることを選択しました。

一言で言えば、AI はコミュニティ環境を汚染します。

さらに、アメリカ版Redditには、ChatGPTのセクションやトピックが多数あります。

多くのユーザーがこのコラムでさまざまな質問をし、ChatGPT ボットがそれらすべてに回答します。

しかし、それは依然として同じ古い質問であり、答えの正確さは不明です。

しかし、この現象の背後には、実はもっと大きな危険が潜んでいます。

AIを誤用するとAIが台無しになる

AI モデルは大量のインターネットデータを取得しますが、情報の信憑性と信頼性を効果的に識別することはできません。

その結果、私たちは目もくらむほどの量の、急速に生成される低品質のコンテンツに直面することになります。

ChatGPT のような大規模なモデルがこのようなデータでトレーニングされた場合、結果がどうなるかは想像しにくいです...

このような AI の乱用は、結果として自己破壊の一形態となります。

最近、英国とカナダの研究者が「再帰の呪い: 生成されたデータでのトレーニングによりモデルが忘れてしまう」というタイトルの論文を arXiv に発表しました。

同報告書は、AI生成コンテンツがインターネットを汚染している現状について議論した後、モデル生成コンテンツを使用して他のモデルをトレーニングすると、結果として得られるモデルに回復不可能な欠陥が生じる可能性があるという憂慮すべき調査結果を発表した。

AI が生成したデータのこの「汚染」により、モデルは現実の認識を歪め、将来的にはインターネットデータをクロールしてモデルをトレーニングすることがより困難になるでしょう。

この論文の著者であり、ケンブリッジ大学とエディンバラ大学の安全工学教授であるロス・アンダーソン氏は率直にこう語った。

私たちが海をプラスチックで満たし、大気を二酸化炭素で満たしたように、インターネットをでたらめで満たそうとしている。

偽情報が飛び交う状況について、Google Brainの上級研究科学者であるダフネ・イッポリト氏は「今後はAIによるトレーニングを受けていない高品質なデータを見つけることがさらに難しくなるだろう」と指摘。

このような意味のない低品質の情報が画面に何度も表示されると、AI はデータのトレーニングを行わなくなり、出力結果にどのような意味があるのか?

この状況を踏まえて、大胆なことを想像してみましょう。ゴミや偽りのデータの環境で育った AI は、人間に進化する前に、「知的障害のあるロボット」や精神障害を持つ心理的に歪んだ人間に組み入れられる可能性がある。

1996 年の SF コメディ映画「A lot of Husbands」と同様に、この映画は、自分自身をクローン化し、さらに自分のクローンをクローン化する普通の男性の物語です。クローンが作られるたびに、クローンの知能レベルは急激に低下し、愚かさが増します。

その時、私たちは不条理なジレンマに直面することになるかもしれない。人間は素晴らしい能力を持つ AI を作ったが、それは退屈で愚かな情報で満たされているのだ。

AI に偽のジャンクデータしか与えられなかった場合、どのようなコンテンツが作成されると考えられますか?

その時が来れば、私たちは皆、過去を懐かしみ、真の人間の知恵に敬意を表することになるでしょう。

そうは言っても、すべて悪いニュースというわけではありません。たとえば、一部のコンテンツプラットフォームは、AI が低品質のコンテンツを生成する問題に注目し始めており、これを制限するための関連規制を導入しています。

一部の AI 企業は、AI によって生成された虚偽情報やスパム情報の爆発的な増加を抑えるために、AI によって生成されたコンテンツを識別できる技術の開発も始めています。

参考リンク:
[1] https://www.v2ex.com/t/948487.

[2]https://twitter.com/oran_ge/status/1669160826186633219.

[3]https://www.qbitai.com/2022/12/40167.html.

[4] https://arxiv.org/abs/2305.17493v2.

[5] https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250.

[6] https://futurism.com/ai-generates-fake-news.

<<: ChatGPTでPPTを書く別の方法

>>: GPT-4 は人間よりも資金調達を理解しています。 AIビジネスプランがベンチャーキャピタルを熱狂させる

AutoRLについてまだよく知らないという人は、オックスフォード大学、Google、その他の機関の12人以上の学者がレビューを書いています。

AIは中国のインターネットを狂ったように汚染している

AI汚染の原因は1つではない

AIを誤用するとAIが台無しになる

AutoRLについてまだよく知らないという人は、オックスフォード大学、Google、その他の機関の12人以上の学者がレビューを書いています。

2021年、人工知能は再び疫病との戦いで役割を果たすだろう

LeCunの新作、カード1枚でトレーニングできる！分散正規化、スパースエンコーダがクラッシュしなくなりました

Transformer のコンテキスト学習機能はどこから来るのでしょうか?

レポート：AI関連職の年間給与は8.9％減少し、収入は2018年より低い

AI を医療業界のあらゆる側面に深く統合するにはどうすればよいでしょうか?

北京大学の動画モデルが新たなSOTA、AIは数秒で面白いTik Tok動画の面白いポイントを理解できる

モデル推論が5〜20倍向上します。1行のコードで複数のDLコンパイラをテストできます。ハードウェアを理解していなくてもこのライブラリを使用できます。

機械学習の次元削減手法で「次元の呪い」を打破する

推薦する

IoTとAIの相乗効果：ビジネスの未来に革命を起こす

プレミアリーグの試合にファンを呼び戻すために AI は何ができるでしょうか?

機械学習の参入障壁が下がり、機械学習エンジニアのポジションがなくなる可能性も

エンティティと値オブジェクトの特性を識別する

人工知能の新たなブレークスルー：ニューラルネットワークが画像内の物体を自律的に識別できる

MITとGoogle BrainはAIを使って「現代のロゼッタストーン」として知られる失われた古代の文書を解読する

TensorFlow を使用した LSTM モデルの構築に関する詳細なチュートリアル

2019年の中国の人工知能産業と産業配置の分析

OpenAIの共同創設者Karpathyがアルパカに恋をする: 赤ちゃんLlama2を実装する純粋なCコード、MacBookが動作可能、1.6kの星を獲得

カリフォルニア大学バークレー校と他の研究チームは、岩の多い海岸や草原を横断しながら、変化する環境にリアルタイムで素早く適応する新しいロボット動作アルゴリズムを開発している。

GPT-4 に追いつく!李開復のYi-34Bの新しい結果が発表されました：勝率94.08％はLLaMA2などの主流の大型モデルを超えています

AIは急速に変化しています。コンピュータービジョンの未来はどこにあるのでしょうか?

人工知能、自動化、そして仕事の未来: 答えが必要な 10 の質問!