AIGC の 7 つの暗い側面

AIGC アルゴリズムがあらゆるスタイルの素晴らしいアートワークを生成し、素晴らしい文法で長い記事を瞬時に作成する方法に誰もが驚いています。どの CIO や CEO も、AI がビジネスにどのような変化をもたらすかを説明するために 1 つか 3 つのスライドを用意しています。

この技術はまだ初期段階ですが、その能力はすでに否定できないものです。コンピューティングの次の波では、おそらくワークフローの複数の場所で AIGC が使用されるようになり、この傾向は止められないものとなるでしょう。

何が問題になるのでしょうか? まあ、いろいろあります。終末論者は、完全な経済破壊と人類の奴隷化を想像します。

最悪のシナリオが起こらなかったとしても、すべてが完璧になるわけではありません。 AIGC アルゴリズムはまだ非常に新しく、急速に進化しているため、基本的な部分に欠陥が見られる可能性があります。これらのアルゴリズムをさらに深く調べると、まだ成果が得られていない箇所が見つかります。

ここでは、AIGC アルゴリズムの 7 つの秘密について説明します。このテクノロジーを企業のワークフローに組み込む方法を計画する際には、これらの秘密に留意してください。

彼らは何もないところからエラーを作り出します。

大規模な言語モデルが、砂鶴の交尾の儀式や 17 世紀東ヨーロッパの建築における隆起の重要性といった、あまり知られていないテーマについて 1,000 語のエッセイを作成する方法には、ほとんど魔法のようなところがあります。しかし、同じ魔法によって、何もないところからエラーを作り出すことも可能になります。彼らは、大学で英語を学んだ学生の能力に合わせて動詞や文法を当てはめながら、歩き回っています。事実の多くは完全に正しいです。そして、なんと、彼らはまるで小学4年生が嘘をついているかのように、何かをでっち上げたのです。

大規模言語モデルの構造により、これは避けられません。彼らは確率を使って単語がどのように組み合わさるかを理解します。時々、数字が間違った単語を選択することがあります。彼らを導く本当の知識やオントロジーさえも存在しません。それは単なる偶然であり、サイコロの出目が間違っていることもあります。私たちは新たな優れた存在と融合していると考えているかもしれませんが、実際には、サイコロの出目の順序にシグナルを探しているラスベガスのギャンブラーたちと何ら変わりません。

彼らはデータのふるいである

人間は、一部の詳細は内部の者だけが知っており、一部は全員と共有されている、複雑な知識の階層を作ろうと試みてきました。こうした希望的階層構造は軍隊の階級制度に最も顕著に表れていますが、多くのビジネスにも存在しています。これらの階層を維持することは、IT 部門やそれを管理する CIO にとって面倒な作業になることがよくあります。

大規模な言語モデルは、これらの分類にはあまり適していません。コンピューターは、ほぼ無限の複雑さを持つカタログを維持できる究極のルールフォロワーですが、大規模な言語モデルの構造では、一部の詳細を秘密のままにして、一部を共有することは実際には許可されません。これらはすべて、マルコフ連鎖上の確率とランダムウォークの巨大な集合体にすぎません。

大規模な言語モデルが確率を使用して 2 つの事実を結び付け、名目上は秘密の事実を推測する不気味な瞬間さえあります。人間も同じ詳細を与えられたら同じことをするかもしれません。

いつか大規模な言語モデルが強力な秘密層を維持できるようになるかもしれませんが、今のところ、これらのシステムは、漏洩しても騒ぎにならないような非常に公開された情報に基づいてトレーニングされる方が適切です。企業のデータ侵害や大規模な言語モデルのガードレールの回避に関わる注目を集めた事例がいくつかありました。一部の企業は AI をデータ侵害を阻止するツールに変えようとしていますが、これを実現する最善の方法がわかるまでにはしばらく時間がかかるでしょう。それまでは、CIO は提供されるデータを厳重に管理したほうがよいでしょう。

怠惰を奨励する

人間は機械を信頼するのが得意であり、特にそれが仕事の維持につながる場合はそうだ。大規模な言語モデルがほとんどの場合に正しいことが証明されると、人間は常にそのモデルを信頼し始めます。

人間に AI を二重チェックするよう依頼しても、結果はあまり良くありませんでした。人間は AI が正しいことに慣れてしまうと、道を見失い始め、機械が正しいだろうと信じ始めます。

この怠惰が企業全体に浸透し始めました。人間は自分で考えることをやめ、やがてビジネスは停滞し、エネルギーが低下し、誰も既成概念にとらわれずに考えようとしなくなります。競争相手が現れるまで、しばらくはリラックスしてストレスフリーでいられるでしょう。

実際のコストは不明

大規模言語モデルの使用にかかる正確なコストは誰にもわかりません。ああ、多くの API には各トークンのコストを詳細に示す値札が付いていますが、この金額はベンチャーキャピタルによって大幅に補助されているという兆候があります。 Uber のようなサービスでも同じことが起こっています。投資家の資金が尽きるまで価格は低いままですが、その後急騰します。

現在の価格は、最終的に市場を支配する真の価格ではないという兆候がいくつかあります。良質の GPU をレンタルして稼働させ続けるには、はるかに高額な費用がかかる可能性があります。ラックにビデオカードを搭載することで、大規模な言語モデルをローカルで実行する際に多少のコストを節約できますが、必要なときにのみマシンの料金を支払うなど、ターンキーサービスの利点がすべて失われます。

著作権の悪夢だ

市場にはすでに、高校の宿題や大学入学エッセイの作成といった一般的な雑用を処理できる、優れた大規模言語モデルがいくつか存在しています。学生の自立心、意欲、文章力、道徳心、そして自分で考える能力を重視しています。

しかし、ほとんどの企業には AI が引き受けられるような一般的な雑用はありません。彼らには、特定のビジネスに合わせた結果が必要です。基本的な大規模言語モデルは基盤を提供できますが、それでも広範なトレーニングと微調整が必要です。

このトレーニングデータを収集する最良の方法を理解している人はほとんどいません。幸運なことに、自社で管理できる大規模なデータセットを保有している企業もあります。しかし、ほとんどの人は、著作権を取り巻くすべての法的問題が解決されていないことに気づいています (ここ、ここ、ここ)。著者の中には、自分の著作を AI の訓練に利用することに関して相談を受けなかったとして訴訟を起こした人もいます。アーティストの中には盗作されたと感じている人もいます。プライバシーの問題はまだ解決中です (こちらとこちら)。

顧客のデータで AI をトレーニングできますか? 著作権の問題は解決されていますか? 適切な法的フォームがありますか? データは正しい形式ですか? ビジネスですぐに使用できる、カスタマイズされた優れた AI の作成を妨げる問題はたくさんあります。

ベンダーロックされている可能性があります

理論的には、AI アルゴリズムは、ユーザーインターフェイスの複雑さをすべて抽象化した一般化されたツールです。彼らは独立していて、自己完結的で、人生が、あるいは彼らが仕える愚かな人間たちが投げかけるどんな困難にも対処できるはずです。言い換えれば、API としては、厳格であってはなりません。理論的には、AI エージェンシーは単純に適応するため、ベンダーを迅速に変更するのは簡単なはずです。ベンダーを変更するときに、グルーコードを書き直したり、頭痛の種となる作業をすべてプログラマーのチームで行う必要はありません。

しかし、現実には違いが残っています。 API はシンプルかもしれませんが、呼び出しの JSON 構造など、違いはありますが、実際の違いは奥深くに隠されています。AIGC のプロンプトの作成は真の芸術であり、AI から最高のパフォーマンスを引き出すのは簡単ではありません。これらの特異性を理解し、より優れたプロンプトを作成して、より優れた回答を提供できる賢い人々の仕事内容はすでに存在しています。API の違いが小さくても、プロンプト構造の奇妙な違いにより、AI をすばやく切り替えることが困難になります。

彼らの知性はまだ非常に浅い

教材に対する何気ない親しみと、深く知的な理解との間のギャップは、大学では長い間テーマとなってきました。「少しの学問は危険なものだ。ピエールの泉の水をたっぷり飲まないか、まったく味わわないかだ」とアレクサンダー・ポープはかつて書いた。それは 1709 年のことだ。

他の賢明な人々も、人間の知性の限界に関する同様の問題を指摘しています。ソクラテスは、自分が知っていることすべてにおいて、実際には何も知らないのだと結論づけます。シェイクスピアは、賢者は自分が愚か者であることを知っていると信じていた。

リストは長く、認識論に関するこれらの洞察のほとんどは、何らかの形で AIGC の魔法に当てはまり、多くの場合、より大きな範囲で当てはまります。 CIO とテクノロジーリーダーシップチームは困難な課題に直面しています。彼らは、生産性の高い AI が提供できる最高のものを活用しつつ、人間、エイリアン、コンピューターなど、あらゆる場所の知能にとって長年問題となってきたあらゆる知的難関に陥らないように努める必要があります。

<<: コンサルタントは AI に置き換えられるでしょうか?主流のコンサルティング会社：心配するよりも受け入れる

>>:

ブログ

AIGC の 7 つの暗い側面

彼らは何もないところからエラーを作り出します。

彼らはデータのふるいである

怠惰を奨励する

実際のコストは不明

著作権の悪夢だ

ベンダーロックされている可能性があります

彼らの知性はまだ非常に浅い

スタンフォード大学の人工知能レポート: 今からでも遅くはない

ジャック・マー：テクノロジーは私たちの生活をより健康にしなければ意味がない

コーディングが ChatGPT を圧倒します! UIUCと清華大学が共同で7BパラメータのMagicorderをリリース、コードデータの重みは完全にオープンソース

PaddlePaddle パノラマビューが初めて公開され、11 の新機能とサービスハードコアリリース

5分でわかるReLU: 最も人気のある活性化関数

3分レビュー！ 2021年12月の自動運転業界の開発動向を簡単に概観

スマートセキュリティカメラの3つの主要市場

推薦する

大手モデルサークルは「GPU が貧弱」について熱く議論している。Google の計算能力は他のすべての企業を合わせたよりも高いことが明らかになり、スタートアップに打撃を与えている。

人間の仕事が危機に瀕しているか？この時代にいかに目立つかが非常に重要です

Liang Yanbo: データマイニングと機械学習アルゴリズム

総合異常検知の新たな夜明け：華中科技大学などがGPT-4Vの総合異常検知性能を明らかに

2024年のビッグデータ産業予測（I）

モデル、データ、フレームワークの観点から、効率的な大規模言語モデルに関する54ページのレビューを紹介します。

AI業界は大きな変化を遂げています。AI科学者がMVPになるには

単一ニューロンは将来の活動を予測することで学習し、脳の働きを説明するのに役立つ。

完璧な切り抜き王ビンビン！ ByteDanceのインターンが開発したAIにより、4K 60fps動画のリアルタイム切り抜きが可能に

データを盗むために設計された8つの偽ChatGPTマルウェアアプリ