Googleの失敗が露呈: 内部にリーダーがおらず、生の画像の仕組みが「多様」すぎた

Google Geminiの写真をめぐる論争はまだ収まらず、さらに衝撃的な内部情報が暴露された。

Pirate Wires は、Google が Gemini の障害をまったく知らなかったわけではなく、障害は「意図的」なものであったことを明らかにした。

具体的には、Google は、Gemini が実際に 3 つのモデルを実行してグラフを生成する「安全な」アーキテクチャを構築しました。

大まかに言えば、プロセスは次のようになります。

ユーザーは、チャットインターフェイスで Gemini に画像の生成を要求します。要求を受信すると、Gemini は要求を小さいモデルに送信します。

この小規模モデルの役割は、会社の「多様性」ポリシーに従ってユーザーのプロンプトを書き換えることです。

これを実現するために、この小規模モデルは、Google の詳細な複数ページにわたる「多様性」ポリシー文書を使用して「序文」が付けられた別のモデル (第 3 のモデル) によって生成された合成データで LoRA テクノロジーを介してトレーニングされました。

したがって、小さいモデルがユーザーのプロンプトを書き換えると、「自動車整備士を見せてください」は、「オーバーオールを着て笑顔のアジア人自動車整備士を見せてください」、「レンチを持っているアフリカ系アメリカ人の女性自動車整備士」、「ヘルメットをかぶったネイティブアメリカンの自動車整備士を見せてください」などになります...

さらに、書き換えられたプロンプトは、検査のために拡散モデルに送信され、プロンプトの単語が標準の安全ポリシー（子供に関する内容、実在の人物の画像など）に違反していないことを確認します。最後に画像が生成され、生成された画像は再度チェックされてからユーザーにフィードバックされます。

要約すると、ユーザーが最終的に受け取るのは、Google の「多様化」の浄化の層を経た「入れ子人形」スタイルで生成された結果です。

しかし、このような「多様化」はやや行き過ぎである。

その程度はあまりにも極端で、かつてGoogle Venturesで働いていたSequoia Capitalのパートナー、ショーン・マグワイアでさえ批判せざるを得なかった。

私は白人だからという理由でGoogleで昇進しませんでした。

写真

その言葉は彼の怒りを隠さなかった。

写真

マスク氏はまた次のようにコメントした。

近年、このような状況は非常に一般的になっています。

写真

Pirate Wires は、関係する Google 社員にインタビューした後、この背後にあるより深い理由は、Google に現在リーダーがいないことだと述べた。

名前を明かさないある上級 Google エンジニアは、「Google で良い製品を発売するのは不可能だと思う」とさえ言った。

グーグルで広がる「恐怖の文化」

以前、ジェミニのグラフィックは意図的に白人のイメージを生成することを拒否し、それが欧米の世論環境で大きな論争を引き起こしました。

写真

その後、この機能は棚から撤去せざるを得なくなり、親会社であるAlphaBetの株価は一時11%以上下落し、非常に深刻な結果をもたらしました。

海外メディアのPirate Wiresは、関係するGoogle社員にインタビューした結果、Geminiの失敗はGoogleの貧弱なDEI文化に関連していることを突き止めた。

(DEIは「Diversity, Equity, Inclusion」の略称で、中国語で「多様性、公平、包摂」を意味します。企業やその他の組織で、より多様で平等で包括的な環境を促進するために広く使用されている概念です)

ジェミニプロジェクトに近い人物によると、ジェミニチームはリリース前に「過度の多様性」の問題を実際に認識していたという。人種問題はさておき、最も無害な検索結果の品質にさえ深刻な影響が出るだろう。

冒頭で述べた 3 つのモデルはいずれも「多様性」を高めるために設計されています。セキュリティアーキテクチャに携わったことがある人によると、関係するチームは「エンジニアリング時間の半分をこれに費やすこともある」そうです。

さらに、この複雑なアーキテクチャに対する姿勢と採用の度合いについては、社内でも意見の相違がありました。「Gemini プロジェクトが公表された後に失敗したとき、チームだけでなく会社全体が非常にフラストレーションを感じ、敗北感を覚えました。」

これに関して、Google の創設者セルゲイ・ブリン氏は数日前に AI ハッカソンに出演し、関連することも明らかにしました。

誰もが遊んでいるGemini 1.5 Proモデルの誕生は、実は単なる偶然でした。

私たちがそれを訓練したとき、それは単に実験の規模を拡大する試みであり、それがこれほど強力になるとは予想していませんでした。

そのパフォーマンスの良さを目の当たりにして、私たちはもう待つつもりはなく、世界中の人々に試してもらいたいと思いました。

さらに重要なのは、社内には同様の状況が数多く存在し、ジェミニの生写真はまさにそれらの縮図に過ぎないということです。

たとえば、エンジニアが「ビルド忍者」、「古いキャッシュを消去」、「サニティチェック」、「ダミー変数」などの用語を使用しないよう、文化の盗用、軍事的比喩、軽蔑的な精神疾患、軽蔑的な障害に該当するという理由で主張する人がいたことが明らかになりました。

あるエンジニアは、会社のプロフィールで自分自身を指すために、「zie/hir」、「ey/em」、「xe/xem」、「ve/vir」などの多様な代名詞の組み合わせを使用するよう強く勧められました。

グレイグラーズ（「グーグル」と「グレイ」を組み合わせた造語）と呼ばれる別のグループも、名称変更を進めている。

Greyglers グループは、40 歳以上のシニア社員のグループです。40 歳以上の人全員が白髪になっているわけではないと考える人もいるため、グループ名には「包括性」が欠けています。Google はグループ名を変更するために外部のコンサルタントを雇ったとさえ報じられています。

Pirate Wires はまた、インタビューを受けたほぼ全員が「恐怖の文化」という言葉を使っていたことも明らかにしました。これは、企業における極端な DEI 実践に対する抵抗の欠如だけでなく、世界で最も技術的に恵まれた場所の 1 つにおけるイノベーションの欠如も説明しています。

あらゆるレベルの従業員は、ほとんどあらゆる理由から、会社を停滞させている多くのプロセスに異議を唱えることを恐れています。プロモーション期間以外では、ほとんどの人が注目されることを恐れています。

昇進したいと思っていても、人種や性別によって昇進の可能性は左右されます。

しかし、それは本当にそれほど単純なことなのでしょうか。また、DEI 思考の管理が制御不能になっていることが原因なのでしょうか。

Google はなぜこれを行っているのでしょうか?

Pirate Wires の記事では、これは同社のより大きな問題の単なる「症状」であり、その問題は「リーダー不在」という 4 つの言葉で要約できるとしている。

まず、Google は現在、典型的な「イノベーションのジレンマ」に直面しています。つまり、完全に自社の能力の範囲内で新しい技術を開発すると、既存のビジネスモデルが破壊されるということです。

第二に、そしてもっと重要なことは、誰も責任を負わないということです。

Pirate Wires は、Google のほぼすべての主要製品の管理チーム、エンジニアリング、営業、信頼とセキュリティ、広報、マーケティングの担当者と話をした結果、Google の現状は報道されているよりもはるかに暗いと述べている。

Google は、ビジョンもリーダーシップもなく、制御不能で金を稼ぐ検索独占企業であり、その非常にサイロ化された文化のせいで、チーム間で実際に何が起こっているのかほとんど理解していませんでした。

写真

何千人もの人々が、それぞれ異なる時期に、大きなパズルのさまざまなピースに取り組んでいますが、その間の協力はほとんどありません。たとえば、チーム間の協力者が Gemini チームを支援しようとしたとき、彼らは失敗するか無視されました。

従業員同士をつなぐ唯一のチャネルは、強力で広範囲に及ぶ人事官僚機構です。

そして、創業者のラリー・ペイジ、セルゲイ・ブリン、そしてCEOのサンダー・ピチャイによる奇妙な経営により、ほとんどの従業員は誰が会社の本当の責任者なのか分からず、不確実性は会社全体でおなじみのテーマとなっている。

そのため、ピチャイの愛称で知られるCEOのサンダー・ピチャイ氏は世間の批判の的となっている。Business Insiderによると、ウォール街では現CEOのピチャイ氏の退任を求める声がさらに高まっているという。

ある Google エンジニアはこう言っています。「サンダーは Google のバルマーです。機能しない製品、無秩序な拡大、過剰な雇用、これらすべてが彼のリーダーシップの下で起こったのです。」

参考リンク:
[1] https://www.piratewires.com/p/google-culture-of-fear
[2] https://twitter.com/shaunmmaguire/status/1736082530573422762

<<: ViT以外にも、美団、浙江大学などが、視覚タスクのための統合アーキテクチャであるVisionLLAMAを提案した。

>>:

マイクロソフトは、劣化が著しい古い写真を復元できる新しいアルゴリズムを開発した。

ブログ

「最強の7Bモデル」論文が発表され、ラマ2の13Bバージョンを超える方法が明らかになった

Googleの失敗が露呈: 内部にリーダーがおらず、生の画像の仕組みが「多様」すぎた

グーグルで広がる「恐怖の文化」

Google はなぜこれを行っているのでしょうか?

マイクロソフトは、劣化が著しい古い写真を復元できる新しいアルゴリズムを開発した。

マスク氏、ロボット「オプティマスプライム」が服を畳む動画を公開、動きはゆっくりだが自然

人工知能の新たな用途：死者の蘇生

「最強の7Bモデル」論文が発表され、ラマ2の13Bバージョンを超える方法が明らかになった

人工知能に関する4つの大きな誤解

AI、VR、ブロックチェーンにより、新しい時代は貧しい人々にとっての楽園となるのでしょうか？

推薦する

マスク氏と陳天橋氏の両者が期待している脳コンピューターインターフェースは、将来いつ実現するのだろうか？

何も知らない状態から、3分で「ナレッジグラフ」を素早く理解するまで

人工知能人材の需要は倍増し、アルゴリズム人材の不足は170万人に達した

オラクルCEOハード氏「AIについて心配する必要はない」

人工知能に関してどのような基礎教育が必要でしょうか?

OpenAI が GPT をロボットの脳に組み込み、具現化された AGI のシンギュラリティが近づいています。エヌビディアとマイクロソフトがユニコーン企業フィギュアキャピタルに26億ドルを投資

やめる！ Google は米国国防総省の 100 億ドルの契約への入札を断念しました。

3つのシナリオは、人工知能が新しい小売業に力を与える方法を示しています

無補助外骨格メカNK01がゼロワンテクノロジーフェスティバルで公開される

.Net Framework ガベージコレクション固有のアルゴリズムの詳細な説明

プロセス制御に人工知能をうまく導入する方法

予知保全: 畳み込みニューラルネットワーク (CNN) を使用したセンサー障害の検出