ChatGPTのメタバージョンが登場: Llama 2がサポートされ、Bing検索に接続され、ザッカーバーグがライブでデモを実施

今朝早く、毎年恒例の Meta Connect カンファレンスで、AI に焦点を当てた一連の発表が行われました。

Ray-Ban と共同で開発された最新の MR ヘッドセットやスマートグラスだけでなく、最も重要なのは、Meta が、複数ラウンドの会話のための AI アシスタントから画像編集に至るまで、生成 AI テクノロジーを活用した新機能をすべてのコミュニケーションアプリ、Meta Quest 3、将来の Ray-Ban Meta スマートグラスに組み込むことです。

これらすべてのリリースに関係する AI テクノロジーは、これまでで最も強力なオープンソースの大規模モデルである Llama 2 に基づいています。しかし、Metaは、より強力なLlama 3が2024年に発売されることも事前に明らかにした。

Meta は Connect カンファレンスで、AI ステッカーや画像編集などの機能を強化するために使用される新しい画像ジェネレーター「Emu」も発表しました。

チャットボット「Meta AI」のMeta版がリリース

ビッグモデルの登場後、テクノロジー企業は次々と新しいAIボットをリリースしている。オープンソース側をリードするMetaも例外ではない。同社はWhatsApp、Messenger、Instagramなどのメッセージングアプリケーションで、一連の新しいAIボットをリリースしている。水曜日から、この新しい大規模モデル機能は米国の一部ベータユーザーに提供される予定です。

ザッカーバーグがMeta版ChatGPTを披露

Meta AIと呼ばれるこのAIアシスタントは、OpenAIのChatGPTやAnthropicのClaude 2などのチャットボットに非常によく似ています。

ザッカーバーグ氏は、ユーザーはグループチャットを通じてビッグモデルから支援を受けたり、友人と旅行を計画したり、知識に関する質問の答えを得たり、マイクロソフトのBingを通じてインターネットを検索してリアルタイムのウェブ検索結果を得たりできるようになると述べた。

Facebook の以前の仮想アシスタント M とは異なり、カスタマイズされた Meta AI アシスタントは、より幅広いユーザーグループを対象としており、完全に自動化されています。そのモデルは以前の会話を参照し、「非常に簡潔な」回答を返すように調整できます。

つまり、最新の AI アシスタントには強力なコンテキスト学習機能が必要です。それを実装する方法に関しては、Meta は新しい論文でその背後にある技術も紹介しています。

論文アドレス: https://ai.meta.com/research/publications/effective-long-context-scaling-of-foundation-models/

上記の論文では、Meta は LLAMA 2 チェックポイントを継続的に事前トレーニングすることでモデルを構築し、追加の 4000 億トークンを長いトレーニングシーケンスとして使用しています。このモデルファミリでは、より小さい 7B/13B バリアントはトレーニングに 32,768 個のトークンシーケンスを使用し、34B/70B バリアントは 16,384 個のトークンシーケンスを使用します。

既存の研究で実施された限定的な評価とは異なり、Meta は言語モデリング、合成タスク、および長いコンテキストと短いコンテキストのタスクをカバーするさまざまな実際のベンチマークを使用して、モデルを広範囲に評価します。言語モデリングの観点では、Meta のモデルはコンテキストの長さに関して明確なべき乗則スケーリング動作を示します。このスケーリング動作は、モデルがより多くのコンテキストから一貫して恩恵を受けることができることを示唆するだけでなく、コンテキストの長さが LLM をスケーリングするためのもう 1 つの重要な軸であることも示唆しています。研究ベンチマークで新しいモデルを LLAMA 2 と比較すると、長いコンテキストのタスクで大幅な改善が見られるだけでなく、標準的な短いコンテキストのタスク、特にエンコーディング、数学、知識のベンチマークでも適度な改善が見られます。

研究者らは、人間が注釈を付けたデータなしで継続的に事前トレーニングされる長いモデルのガイド付き微調整を実行するためのシンプルで費用対効果の高い方法を研究しました。最終結果として、チャットモデルは、質問への回答、要約、複数ドキュメントの集約タスクなど、さまざまな長期コンテキストベンチマークで全体的に gpt-3.5-turbo-16k よりも優れたパフォーマンスを発揮しました。

現在、Meta AI はどのチャットでも呼び出すことができます。 ChatGPTがDALLE・3にアクセスするのと同様に、Meta AIは独自の画像生成モデルEmuを使用して透かし入り画像を生成できます。

Meta AIに加えて、Metaは本日、ケンダル・ジェンナー、ドウェイン・ウェイド、ミスタービースト、パリス・ヒルトン、チャーリー・ダメリオ、スヌープ・ドッグなど、特定の有名人の性格を真似ることができる大型モデルである「AIキャラクター」シリーズも発表した。ベア・グリルス、クロエ・キム、ジョシュ・リチャーズなどのボットも近々登場する予定だ。 Meta AI と同様に、チャットボットは Meta のメッセージングアプリ内に存在し、実際の人間と同じようにプロフィール画像とタイムラインを持ちます。彼らとチャットすると、会話に応じてアバターが微妙に動きます。

Metaは、セキュリティを確保するために、問題のあるユースケースを探すのに6,000時間を費やし、モデルをリリースする前に社内でモデルを操作する従業員を採用したと述べた。また、同社はポリシーに違反するコンテンツを検出して対処し、Meta AI以外のチャットボットによるウェブ検索をブロックする新しい技術を開発したと主張している。

画像生成分野のもう一つのプレーヤー：Emu

カンファレンスでは、ザッカーバーグ氏は新しい画像生成モデル「Emu」も紹介した。

Emu という名前は Meta の動物テーマを引き継いでいます。これは、DALL-E や MidJourney などの人気アプリケーションに対する Meta の公式な対応であり、「Generative AI Expressions」と「Image Editing」という 2 つの重要な新機能もリリースされました。

Emu を搭載したこの新機能により、ユーザーは数秒で独自の AI 絵文字を作成できるようになり、WhatsApp、Messenger、Instagram、さらには Facebook Stories などの Meta 所有のアプリでもまもなく利用できるようになります。

ザッカーバーグ氏は「人々はチャットの内容を表現するために毎日何億もの絵文字を送信しています。チャットはそれぞれ異なり、人々は微妙な感情の違いを表現したいと考えています。しかし、現在、絵文字の数は決まっています。Emuを使えば、好きなものを何でも入力できます」と語った。

具体的には、この機能を使用するには、ユーザーはテキストボックスに表示したい画像を入力します。

Meta によれば、複数のインスタント共有オプションを生成するには平均 3 秒かかります。

さらに、Meta は Instagram アプリケーションで「画像編集」機能をまもなく開始する予定です。ユーザーは自分の画像を変換したり、友人と協力して、Emu のテクノロジーを活用した AI 生成画像を作成したりできます。

「スタイル変更」オプションを例に挙げてみましょう。「水彩」またはより詳細なプロンプトを入力することで、ユーザーは画像の視覚的なスタイルを変更できます。

現場でザッカーバーグ氏は、愛犬「ビースト」の写真を折り紙やクロスステッチ風に加工する実演を披露した。

たとえば、「背景」オプションを使用すると、ユーザーはプロンプトワードを使用して画像のシーンや背景を変更できます。

最近公開された論文では、Meta は Emu の背後にある技術的な詳細も紹介しています。

論文アドレス: https://ai.meta.com/research/publications/emu-enhancing-image-generation-models-using-photogenic-needles-in-a-haystack/

具体的には、Meta は 11 億の画像とテキストのペアで潜在的拡散モデル (LDM) を事前トレーニングし、大規模な画像コーパスから手作業で選択した数千枚の高品質画像でモデルの品質を調整しました。画像選択の基準は主観的であり、文化に依存するものであることを考慮すると。 Meta はこのプロセスで、構図、照明、色、有効解像度、フォーカス、ストーリーテリングなど、いくつかの一般的な写真撮影の原則に従いました。

Meta は潜在拡散アーキテクチャにいくつかの最適化を加えることで、強力な事前トレーニング済みモデルを構築し、品質調整、つまり Emu を通じて生成された画像の視覚的な魅力を大幅に向上させます。視覚的な魅力の点では、Emu は、下の図に示すように、現在のオープンソース SOTA モデル SDXL v1.0 を大幅に上回っています。

さらに、Meta は、品質調整がピクセル拡散とマスク生成 Transformer モデルに同様に効果的な一般的な方法であることも検証しました。

Meta AI が Microsoft Bing ウェブ検索と統合

AIビッグモデルの普及以来、OpenAIとMicrosoftの協力は、検索エンジンからオフィスソフトウェアに至るまで、迅速で緊密かつ包括的なものとなっていることが分かっています。

今回、Meta は Microsoft とのさらなる協力も模索し、Microsoft Bing ウェブ検索を Meta AI チャットエクスペリエンスに統合しました。 7 月初め、Meta と Microsoft は、Windows と Azure 上の大規模言語モデルの Llama 2 シリーズのサポートを発表しました。

マイクロソフトのCEOナデラがMetaとの提携を発表

マイクロソフト副社長兼コンシューマー最高マーケティング責任者のユスフ・メディ氏が、両者の協力関係を紹介した。同氏は、マイクロソフトはMetaと協力し、BingをMeta AIのチャット体験に統合して、リアルタイムの検索情報にアクセスすることで、より即時かつ最新の回答を提供できるようにしていると述べた。ザッカーバーグ氏のライブデモを見てみましょう。

Meta AI チャットボットに加えて、Bing は WhatsApp、Messenger、Instagram でのメッセージ送信など、Meta の他の製品にも統合されます。

画像出典: Twitter @AmadeusSVX

両者の連携により、AI時代のイノベーションが加速し、今後もパートナーシップを拡大し、人々が頻繁に使用する製品に、より強力で便利なAI体験を提供していきます。

MetaとMicrosoftの協力について、一部のネットユーザーは「OpenAIを殺せ」など、興味深いミーム画像を作成した。

画像出典: Twitter @B0wr1ng

ザッカーバーグ氏の動きが確実だと思いますか?

<<: 一般相対性理論の予測に沿って、M87ブラックホールの最新の研究結果がネイチャー誌に掲載されました。

>>: データ汚染はAIシステムにとってますます大きな脅威となっている