Googleの失敗が露呈: 内部にリーダーがおらず、生の画像の仕組みが「多様」すぎた

Googleの失敗が露呈: 内部にリーダーがおらず、生の画像の仕組みが「多様」すぎた

Google Geminiの写真をめぐる論争はまだ収まらず、さらに衝撃的な内部情報が暴露された。

Pirate Wires は、Google が Gemini の障害をまったく知らなかったわけではなく、障害は「意図的」なものであったことを明らかにした。

具体的には、Google は、Gemini が実際に 3 つのモデルを実行してグラフを生成する「安全な」アーキテクチャを構築しました。

大まかに言えば、プロセスは次のようになります。

ユーザーは、チャット インターフェイスで Gemini に画像の生成を要求します。要求を受信すると、Gemini は要求を小さいモデルに送信します。

この小規模モデルの役割は、会社の「多様性」ポリシーに従ってユーザーのプロンプトを書き換えることです。

これを実現するために、この小規模モデルは、Google の詳細な複数ページにわたる「多様性」ポリシー文書を使用して「序文」が付けられた別のモデル (第 3 のモデル) によって生成された合成データで LoRA テクノロジーを介してトレーニングされました。

したがって、小さいモデルがユーザーのプロンプトを書き換えると、「自動車整備士を見せてください」は、「オーバーオールを着て笑顔のアジア人自動車整備士を見せてください」、「レンチを持っているアフリカ系アメリカ人の女性自動車整備士」、「ヘルメットをかぶったネイティブアメリカンの自動車整備士を見せてください」などになります...

さらに、書き換えられたプロンプトは、検査のために拡散モデルに送信され、プロンプトの単語が標準の安全ポリシー(子供に関する内容、実在の人物の画像など)に違反していないことを確認します。最後に画像が生成され、生成された画像は再度チェックされてからユーザーにフィードバックされます。

要約すると、ユーザーが最終的に受け取るのは、Google の「多様化」の浄化の層を経た「入れ子人形」スタイルで生成された結果です。

しかし、このような「多様化」はやや行き過ぎである。

その程度はあまりにも極端で、かつてGoogle Venturesで働いていたSequoia Capitalのパートナー、ショーン・マグワイアでさえ批判せざるを得なかった。

私は白人だからという理由でGoogleで昇進しませんでした。

写真

その言葉は彼の怒りを隠さなかった。

写真

マスク氏はまた次のようにコメントした。

近年、このような状況は非常に一般的になっています。

写真

Pirate Wires は、関係する Google 社員にインタビューした後、この背後にあるより深い理由は、Google に現在リーダーがいないことだと述べた。

名前を明かさないある上級 Google エンジニアは、「Google で良い製品を発売するのは不可能だと思う」とさえ言った。

グーグルで広がる「恐怖の文化」

以前、ジェミニのグラフィックは意図的に白人のイメージを生成することを拒否し、それが欧米の世論環境で大きな論争を引き起こしました。

写真

その後、この機能は棚から撤去せざるを得なくなり、親会社であるAlphaBetの株価は一時11%以上下落し、非常に深刻な結果をもたらしました。

海外メディアのPirate Wiresは、関係するGoogle社員にインタビューした結果、Geminiの失敗はGoogleの貧弱なDEI文化に関連していることを突き止めた。

(DEIは「Diversity, Equity, Inclusion」の略称で、中国語で「多様性、公平、包摂」を意味します。企業やその他の組織で、より多様で平等で包括的な環境を促進するために広く使用されている概念です)

ジェミニ プロジェクトに近い人物によると、ジェミニ チームはリリース前に「過度の多様性」の問題を実際に認識していたという。人種問題はさておき、最も無害な検索結果の品質にさえ深刻な影響が出るだろう。

冒頭で述べた 3 つのモデルはいずれも「多様性」を高めるために設計されています。セキュリティ アーキテクチャに携わったことがある人によると、関係するチームは「エンジニアリング時間の半分をこれに費やすこともある」そうです。

さらに、この複雑なアーキテクチャに対する姿勢と採用の度合いについては、社内でも意見の相違がありました。「Gemini プロジェクトが公表された後に失敗したとき、チームだけでなく会社全体が非常にフラストレーションを感じ、敗北感を覚えました。」

これに関して、Google の創設者セルゲイ・ブリン氏は数日前に AI ハッカソンに出演し、関連することも明らかにしました。

誰もが遊んでいるGemini 1.5 Proモデルの誕生は、実は単なる偶然でした。

私たちがそれを訓練したとき、それは単に実験の規模を拡大する試みであり、それがこれほど強力になるとは予想していませんでした。

そのパフォーマンスの良さを目の当たりにして、私たちはもう待つつもりはなく、世界中の人々に試してもらいたいと思いました。

さらに重要なのは、社内には同様の状況が数多く存在し、ジェミニの生写真はまさにそれらの縮図に過ぎないということです。

たとえば、エンジニアが「ビルド忍者」、「古いキャッシュを消去」、「サニティチェック」、「ダミー変数」などの用語を使用しないよう、文化の盗用、軍事的比喩、軽蔑的な精神疾患、軽蔑的な障害に該当するという理由で主張する人がいたことが明らかになりました。

あるエンジニアは、会社のプロフィールで自分自身を指すために、「zie/hir」、「ey/em」、「xe/xem」、「ve/vir」などの多様な代名詞の組み合わせを使用するよう強く勧められました。

グレイグラーズ(「グーグル」と「グレイ」を組み合わせた造語)と呼ばれる別のグループも、名称変更を進めている。

Greyglers グループは、40 歳以上のシニア社員のグループです。40 歳以上の人全員が白髪になっているわけではないと考える人もいるため、グループ名には「包括性」が欠けています。Google はグループ名を変更するために外部のコンサルタントを雇ったとさえ報じられています。

Pirate Wires はまた、インタビューを受けたほぼ全員が「恐怖の文化」という言葉を使っていたことも明らかにしました。これは、企業における極端な DEI 実践に対する抵抗の欠如だけでなく、世界で最も技術的に恵まれた場所の 1 つにおけるイノベーションの欠如も説明しています。

あらゆるレベルの従業員は、ほとんどあらゆる理由から、会社を停滞させている多くのプロセスに異議を唱えることを恐れています。プロモーション期間以外では、ほとんどの人が注目されることを恐れています。

昇進したいと思っていても、人種や性別によって昇進の可能性は左右されます。

しかし、それは本当にそれほど単純なことなのでしょうか。また、DEI 思考の管理が制御不能になっていることが原因なのでしょうか。

Google はなぜこれを行っているのでしょうか?

Pirate Wires の記事では、これは同社のより大きな問題の単なる「症状」であり、その問題は「リーダー不在」という 4 つの言葉で要約できるとしている。

まず、Google は現在、典型的な「イノベーションのジレンマ」に直面しています。つまり、完全に自社の能力の範囲内で新しい技術を開発すると、既存のビジネス モデルが破壊されるということです。

第二に、そしてもっと重要なことは、誰も責任を負わないということです。

Pirate Wires は、Google のほぼすべての主要製品の管理チーム、エンジニアリング、営業、信頼とセキュリティ、広報、マーケティングの担当者と話をした結果、Google の現状は報道されているよりもはるかに暗いと述べている。

Google は、ビジョンもリーダーシップもなく、制御不能で金を稼ぐ検索独占企業であり、その非常にサイロ化された文化のせいで、チーム間で実際に何が起こっているのかほとんど理解していませんでした。

写真

何千人もの人々が、それぞれ異なる時期に、大きなパズルのさまざまなピースに取り組んでいますが、その間の協力はほとんどありません。たとえば、チーム間の協力者が Gemini チームを支援しようとしたとき、彼らは失敗するか無視されました。

従業員同士をつなぐ唯一のチャネルは、強力で広範囲に及ぶ人事官僚機構です。

そして、創業者のラリー・ペイジ、セルゲイ・ブリン、そしてCEOのサンダー・ピチャイによる奇妙な経営により、ほとんどの従業員は誰が会社の本当の責任者なのか分からず、不確実性は会社全体でおなじみのテーマとなっている。

そのため、ピチャイの愛称で知られるCEOのサンダー・ピチャイ氏は世間の批判の的となっている。Business Insiderによると、ウォール街では現CEOのピチャイ氏の退任を求める声がさらに高まっているという。

ある Google エンジニアはこう言っています。「サンダーは Google のバルマーです。機能しない製品、無秩序な拡大、過剰な雇用、これらすべてが彼のリーダーシップの下で起こったのです。」

参考リンク:
[1] https://www.piratewires.com/p/google-culture-of-fear
[2] https://twitter.com/shaunmmaguire/status/1736082530573422762

<<:  ViT以外にも、美団、浙江大学などが、視覚タスクのための統合アーキテクチャであるVisionLLAMAを提案した。

>>: 

ブログ    

推薦する

出会い系アプリの女の子たちは実はStyleGANによって生成された偽の人物である

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

2023 年の最高の無料 AI アート ジェネレーター

翻訳者 |ブガッティレビュー | Chonglouここ数か月で、生成AIにおいて大きな進歩がありまし...

データサイエンスがソーシャルメディアマーケティング戦略をどう変えるか

人工知能の広範な応用は今日よく知られていますが、人工知能は具体的にどのように企業のソーシャル メディ...

2019年のテクノロジートレンド予測: 5Gが爆発的に普及し、人工知能も勢いを増す

テクノロジー業界にとって、2018年は忘れられない年になる運命にある。結局、シェアサイクルのバブルは...

Programiz: 多くの人がChatGPTを使ってプログラミングを学んでおり、Web開発分野はAIの影響を最も受けやすい

プログラマー育成ウェブサイトProgramizは10月18日、ChatGPTがプログラミング教育分野...

2021年:AIが普及する年

リン・ジエル科学技術の継続的な進歩と発展に伴い、人工知能の発展は時代の必然的な流れであり、我が国の経...

...

AI分野 | ゲームのルールを変える画期的なアイデア10選

[[357174]] AI の旅が始まって以来、私は無限の可能性を秘め、輝かしい歴史に足跡を残してき...

Zhiyuan が最も強力なセマンティック ベクトル モデル BGE をオープンソース化しました。中国語と英語の評価はあらゆる面でOpenAIとMetaを上回る

セマンティック埋め込みモデルは、検索、推奨、データマイニングなどの重要な分野で広く使用されています。...

製造業の発展は新たな課題に直面しており、人工知能が重要な役割を果たすだろう

[[245913]]現在、製造業の発展は新たな歴史的時期を迎えており、世界各国間の競争の焦点となって...

Githubのオブジェクトカウントアルゴリズム

Github を使用しているときに、次のプロンプトを見たことがありますか? $ gitクローンhtt...

AIと人間: 人工知能は常に進歩し、人間は常に進化している

この記事は、公開アカウント「Reading the Core」(ID: AI_Discovery)か...

カスタムデータセットにOpenAI CLIPを実装する

2021年1月、OpenAIはDALL-EとCLIPという2つの新しいモデルを発表しました。どちらも...

.Net Framework ガベージ コレクション固有のアルゴリズムの詳細な説明

.Net Framework は、Microsoft が提供する .NET 開発に基づいた基本環境で...

最新の RLHF は言語モデルの「ナンセンス」を救います!微調整効果はChatGPTよりも優れている、と中国の共著者2人が発表

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...