Google 創設者が正式に LLM 戦争に復帰!ジェミニの開発を導く、OpenAIとMetaとの戦いが迫る

Google 創設者が正式に LLM 戦争に復帰!ジェミニの開発を導く、OpenAIとMetaとの戦いが迫る

4年前に辞任したGoogleの共同創設者がついに復帰!

ウォール・ストリート・ジャーナルの報道によると、セルゲイ・ブリン氏は、強力なジェミニ・システムの構築に取り組むグーグルのAI研究者を支援するために職場に戻ったという。

写真

共同創業者、大型模型の戦場に復帰

ここ数カ月、億万長者のセルゲイ・ブリン氏は、週に3、4日、カリフォルニア州マウンテンビューにあるグーグルのオフィスを訪れ、研究者らと協力してグーグルの次世代の大規模AIシステムの開発を推進している。

写真

セルゲイ・ブリン氏は2019年にグーグルの親会社アルファベットを辞任した後、ほぼ完全に権限を委譲し、会社の事業に介入することはほとんどなかった。

しかし、昨年末からGoogleが開催するAIカンファレンスに何度も参加するようになり、その頻度は大幅に増加した。

彼は、Google が待望する AI モデル「Gemini」の研究者と緊密に協力し、AI プログラムの「損失曲線」などの問題を研究していると報じられている。

事情に詳しい関係者によると、セルゲイ・ブリン氏は人事問題にも介入し、人材獲得競争に注目し、グーグルに最も人気のある研究者を雇うよう促したという。

開発者会議後、株価は上昇している

Google は多くの画期的な AI テクノロジーを開発してきましたが、それを新しい製品に変換するのは競合他社に比べて遅れています。

AI研究における競争は激化しており、Metaが最近発売したLlama 2は大きな話題を呼んでいる。

Google は、GPT-4 と競合できると言われている Gemini と呼ばれる汎用 AI プログラムを構築する予定です。

写真

ジェミニ・プロジェクトを担当するグーグル幹部デミス・ハサビス氏は、最近の全社会議で従業員に対し、ジェミニは今年後半に開始される予定だと語った。

1998年、スタンフォード大学の博士課程の学生だったセルゲイ・ブリン氏とラリー・ペイジ氏はウェブ検索を研究しており、この研究を基に共同でGoogleを設立しました。

2人はスタンフォード大学の博士課程の学生だった頃から一緒に研究をしてきた。

S&P Capital IQによれば、同氏はグーグルの親会社アルファベットの個人株主としてはラリー・ペイジ氏に次ぐ第2位であり、その保有株の価値は約900億ドルに上る。

セルゲイ・ブリン氏は辞任後、公共福祉(新たな形の災害救助など)と飛行船に注力してきた。

グーグルが5月の開発者会議で検索エンジンの新バージョンなどAIを活用した製品を多数発表して以来、親会社アルファベットの株価は10%以上上昇した。

写真

この株価上昇は、古くからのライバルであるマイクロソフトやナスダック総合指数の上昇と一致している。

セルゲイ・ブリン氏とラリー・ペイジ氏が日常業務から退き、ピチャイ氏をグーグルのCEOに昇進させた4年前から、彼らはピチャイ氏と定期的に話をしてアドバイスや励ましを与えているが、毎日小言を言うわけではない。

もちろん、彼らは依然として Google の議決権の過半数を握っており、ピチャイとともに経営委員会のメンバーを務めています。

ピチャイ氏はセルゲイ・ブリン氏の復帰を非常に喜んでおり、さらなる貢献を奨励したと言われている。

Google BrainとDeepMindが合併

Google Brain は、ディープラーニングを使用して幅広く応用できる AI プログラムを構築する方法を研究するために、2011 年に設立されました。

今年、ピチャイ氏はGoogle BrainとDeepMindを合併することを決定した。合併後、DeepMindのCEOであるハサビス氏が新グループであるGoogle DeepMindのCEOに就任した。

写真

ハサビス氏とグーグル・ディープマインドのトップ幹部の多くはロンドンを拠点としており、ロンドンオフィスは事実上、新組織の権力の中枢となっている。

現在、セルゲイ・ブリン氏の復帰は、Google の AI チームの移行期における有益な介入と見ることができる。

多くのグーグル社員は、研究者たちはセルゲイ・ブリン氏の参加を歓迎し、自分たちの仕事が認められたと受け止めていると語った。

ジェミニはGPT-4の最強のライバルになるかもしれない

以前、ハサビス氏はメディアに対し、AlphaGoとGPT-4に似た大規模モデルを組み合わせたGeminiが数か月以内にリリースされると伝えた。

1つは強化学習を使って人間の囲碁チャンピオンを破り歴史に名を残したAIシステムであり、もう1つは現在ほぼすべてのビッグモデルリストを制覇し、他を大きく引き離している最強のマルチモーダルビッグモデルである。Googleはこれら2つのAIを統合したいと考えている。

この目的のために、Google DeepMind は数千万ドル、あるいは数億ドルを投資する準備ができています。

写真

AlphaGo の言語機能を GPT-4 などの大規模モデルと統合することで、Gemini システムの問題解決および計画機能が大幅に強化されます。

また、Gemini は強化学習とツリー探索を使用する AlphaGO を統合しているため、多くのアップグレードが行われる予定です。

たとえば、強化学習により、AI は繰り返しの試行とフィードバックから学習して困難な問題を解決できます。また、ツリー探索法は、ゲームシーンなどのシーンで可能な動きを探索して記憶するのに役立ちます。

2017年、AlphaGo Zeroは人間のデータを使わずにAlphaGoをあっという間に上回りました。

さらに、他の分野(ロボット工学や神経科学など)の技術もジェミニに統合される予定です。

ハサビス氏は、「ジェミニは、アルファ碁システムの利点と大規模言語モデルの驚くべき言語能力を組み合わせたものだと言えます。さらに、他にも興味深い革新がいくつかあるのです」と語った。

Gemini は、以前のモデルにはなかったマルチモーダル機能を備えており、ツールと API の統合が非常に効率的であると言われています。

さらに、Gemini は複数のサイズで提供され、メモリとスケジューリングの将来の革新をサポートするように設計されています。

3月には、Gemini は GPT-4 のように 1 兆個のパラメータを持つだろうという主張がありました。さらに、Gemini はトレーニングに数万個の Google TPU AI チップを使用すると言われています。

写真

先月の Google Developer I/O カンファレンスで、Google は当初から Gemini の目標はマルチモーダルであり、ツールと API を効率的に統合することだと述べました。

当時の Google のプレビューは、「まだ初期段階ではありますが、Gemini にはこれまでのモデルには見られなかったマルチモーダル機能が搭載されており、非常に印象的です」というものでした。

たとえば、LeCun のような AI の巨人は、Transformer は言語モデルの機能をテキストの範囲に過度に制限していると述べています。

人間や動物が行うように、世界の物理的な経験から学ぶことは、人工知能を開発するための最善の解決策かもしれません。

写真

おそらくジェミニによって、人工知能は他の方向でもその可能性を発揮するだろう。

Gemini が Google の最後の抵抗であることは明らかです。

<<:  ChatGPTのAndroid版は来週リリースされます! OpenAIがAI帝国のパズルの最後のピースを完成させる

>>:  南洋理工大学の最新の視覚言語モデルの概要:事前トレーニング、転移学習、知識蒸留

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

OpenAI は大規模なモデル ストアを立ち上げる予定で、開発者は製品を棚に置くことができます。

最近、OpenAIの人気が高まっています。GPTモデル機能のアップデートからセキュリティ問題まで、世...

【WOT2018】不正防止、電力、医療分野におけるAI技術の最先端実践

[51CTO.comより引用] 2018年11月30日から12月1日まで、WOT2018グローバル人...

...

...

数千人を対象とした調査: AI に対する一般の認識はどのようなものでしょうか?

人工知能は世界を変えようとしていますが、問題は、それがどのように起こるのか誰も正確には知らないことで...

テーラーメイド:ChatGPTカスタム指示がAIパーソナライゼーション革命をリード

1. 概要カスタム指示「カスタム指示」は ChatGPT の新機能です。カスタム指示を使用すると、自...

...

AI、IoT、VR、AR、ブロックチェーン、クラウドコンピューティングで建設業界を変革

AI、IoT、ブロックチェーン、AR、VR、クラウドコンピューティング技術が建設業界に新たな形をもた...

賈陽青氏がフェイスブックを辞任し、アリババ・シリコンバレー研究所の副社長に就任したことが明らかになった。

[[258639]] 3月2日の夜、知书でAI人事異動に関する大きなニュースが報じられた。Caff...

...

ほんの数行の Python コードで、将来の子供がどのような外見になるかを予測できますか?強力な人工知能

今回はBaidu Smart Cloudの顔認識機能とPythonを組み合わせて実験してみました。結...

第4世代移動ロボット:凌東科技V-AMRのグローバル発売と投資促進

8月26日、北京の中関村国家自主革新モデル区展示センターで、玲東科技マックスの新製品発表会およびチャ...

TFserving によるディープラーニング モデルの導入

1. TFservingとは何かモデルをトレーニングし、それを外部の関係者に提供する必要がある場合は...

...

...