バードがグーグル一家を爆破!歴史上初めて、大規模なモデルが自己検査のためにオンラインで公開され、電子メール、地図、文書、ビデオがすべて利用可能になりました。

バードがグーグル一家を爆破!歴史上初めて、大規模なモデルが自己検査のためにオンラインで公開され、電子メール、地図、文書、ビデオがすべて利用可能になりました。

バード家のバケツがついに登場!

Bard は今年 3 月にリリースされ、6 か月後、ようやく独自のプラグイン エコシステムを実現しました。豊富な Google アプリケーション API を呼び出して複雑な操作を実行できます。

今後、Bard は、Gmail、ドキュメント、ドライブ、Google マップ、Youtube、Google フライトなどのアプリケーションなど、毎日使用する Google ツールを開いて、そこから必要な情報を検索できるようになります。

必要な情報が複数のアプリケーションやサービスに分散している場合でも、Bard を使用するとすぐに統合できます。

つまり、Google 製品を深く使用すればするほど、Bard の可能性は高まります。

大型モデルの開発に伴い、国内メーカーとGoogleなどの大手企業の両方がアプリケーションエコロジーの方向へ動き始めました。

ファミリーバケットアシスタント

たとえば、グランドキャニオンに行きたい場合、このアクティビティをうまく計画するには非常に詳細な情報が必要です。

そしてバードはその魔法の機能を果たすことができる——

Gmail からのメッセージを読み取り、全員にとって都合の良い日付を選択します。

次に、リアルタイムのフライト情報とホテル情報を検索し、Google マップで空港までの道順を取得します。

YouTube ビデオをいくつか視聴してグランドキャニオンのガイドを作成するのにも役立ちます。

これらのタスクはすべて、Bard による 1 回の会話で完了します。

あるいは、新しい仕事を探していて履歴書を書く必要がある場合は、次のように Bard に指示することができます。

「ドライブから、2023 年 6 月の履歴書を見つけて、短い自己紹介文にまとめてください。」

このようにして、Bard は新しい履歴書の完成をお手伝いします。

「アレックスとの最近のメールのやり取りに基づいて、ビジネス協力計画を作成し、Gmail 経由でアレックスに送信するのを手伝ってください。」

「パリとその周辺のいくつかの都市について先ほど検索した情報に基づいて、旅行ガイドをデザインし、Google ドキュメントに保存してください。」

「議事録に記載されている自分に関する情報はすべて Google Keep に保存しています。」

バードがあなたのためにできることはたくさんあります。そのアイデアは Notion AI に多少似ていますが、後者はさまざまなデータベース内のデータを呼び出すことができません。

ご存知のとおり、データは現在最も不足しているリソースです。

OpenAI と比較すると、Bard の自然な利点は、より多くのデータとアプリケーションです。

今後、Bard はインターネットの検索履歴、閲覧したビデオ、電子メール、ドキュメント、地図に自動的にアクセスし、最も必要な情報を要約できるようになります。

「プライバシーはどうなるの?」と心配する人もいるかもしれません。

これに対し、Googleは、拡張機能をどのように使用するかはユーザーが決めることであり、これらの機能はいつでもオフにできると述べた。

Workspace 拡張機能の使用を選択した場合、人間のレビュー担当者は Gmail、ドキュメント、クラウド ドライブの内容を表示できず、Bard はこのデータを読み取って広告を表示したりモデルをトレーニングしたりすることもできなくなります。

「Googleで検索」してエラーをチェックする

さらに、バードは間違いを犯す可能性があることを積極的に認めた歴史上初のモデルでもあります。

今回、バード氏は「Google It」ボタンを更新し、自ら「再確認」できるようにした。

1 回のクリックで、Bard は自動的に返信をチェックし、あなたが言ったことに根拠があるかどうか、インターネット上の対応するコンテンツでそれを確認できるかどうかを確認します。

バード氏は、緑色でマークされた発言について非常に自信を持っている。なぜなら、Google で検索すれば、それを裏付けるコンテンツを見つけることができるからだ。

オレンジ色にマークされている場合、バードは間違いを犯したことを認めます。インターネットで見つかった情報に基づいて、彼は確かにナンセンスな話をするという間違いを犯したことを知ることができます。

また、誰かが共有リンクを介して Bard の回答をあなたと共有した場合は、それをクリックして会話を続けたり、質問についてより詳細な質問をしたり、それを自分の新しいアイデアのインスピレーションとして使用したりできます。

Googleの最も強力なモデルPalLM 2をベースに

Bard がこれらすべての新機能を実現できたのは、Google が PaLM 2 モデルにアップデートを加えたおかげです。

PalLM 2 は、Google のこれまでで最も高性能なモデルです。

Google は最先端の強化学習技術を使用して PaLM 2 をトレーニングし、より直感的で想像力豊かなものにしました。

現在、Bardが使用できる言語は40以上に拡大しています。

韓国の YouTube Music でマーケティング マネージャーの職の面接を受けたい場合、韓国の音楽業界 (K-POP の人気など) に関する知識が必要な場合は、Bard に面接の質問の準備を依頼できます。

バードに、任意のプログラミング言語で、文中に各単語が出現する回数をカウントするプログラムを作成するように依頼できます。

Bard に文を入力として受け取り、文中の各単語の数を出力するように指示します。句読点は無視され、大文字と小文字は区別されません (例: "the cat and the hat" は、"the": 2、"cat": 1、"and": 1、"hat": 1 としてカウントされます)。

バードはPythonでコードを書きました。

簡単に試してみる

これを見た編集者は思わずウズウズしてしまい、すぐに試してみました。

ただし、バードは基本的に Google ファミリー全体をカバーしています。ただし、航空券、ホテル、地図などは国内ではほとんど必要ありません。

生産性の面では、バード氏に最近受け取った電子メールの簡単な概要を説明してもらいました。

ざっと目を通し、要約すると、Bard と New Scientist Events から次のようなメールが届きました…

エンターテイメントに興味がある場合は、最近の視聴履歴に基づいて、Bard に新しいビデオを推奨するよう依頼できます。

その後、バード氏はNLPと機械学習に関するビデオをいくつか推薦しました。

質問:新しく発売されたiPhone 15 Proはどうですか?

すぐに長く雄弁なレビューが寄せられました。

その答えは十分に信頼できるものでしょうか?それとも、ナンセンスや幻覚がたくさんあるのでしょうか?

早速、新しくアップグレードされた「ダブルチェック」機能を使い、バードさんに再度「セルフチェック」を依頼しました。

リンクをクリックすると、Bard は対応する文を直接強調表示し、簡単に比較および判断できるようにします。

公式紹介にあるように、インターネット上に類似の情報が存在することを表す緑色のほか、インターネット上の情報が AI によって生成された情報と矛盾していることを表すオレンジ色もあります。

ただし、この機能はまだ完璧ではなく、大きなモデルの錯覚の問題を完全に解決することはできません。

例えば、明らかに背面カメラが4つあるMIX Fold 3は、バードによって「トリプルカメラ」に変更されただけでなく、同社もテスト後にそれが正しいと固く信じていました。

たとえば、一部の回答には「Google で検索」ボタンがありますが、結局何も見つかりません。

あるいは、ボタンがまったくないこともあります...(バード自身が作成したシーンではよくあることです)

少し前に話題になった GPU 不足に関する記事のイラストを Bard に入力して、それが何を意味するか聞いてみます。

バードの答えは驚くべきものだった。

あなたが送ってくれた画像は、「GPU がやってくる!」という言葉が書かれた大型貨物船のミームでした。

この画像は、GPU が巨大な貨物船で輸送されていることを示唆しており、現在の状況をユーモラスに誇張しています。これは、GPU 不足に対する人々の不満を表現し、GPU を購入したいという願望を表明する方法でもありました。

同時に、このグラフは、2023 年 9 月時点で GPU 不足が続いているため、現在の時間枠にも関連しています。

しかし、この答えにもいくつか不正確な点があります。たとえば、不足はマイナーやゲーマーによって引き起こされたのではなく、生成 AI による需要の急増によって引き起こされたものです。

しかし、バードがたった一枚の写真に基づいて、これほどの関連性と高揚感を生み出せるというのは、やはり驚くべきことだ。

<<:  ハーバード大学とコロンビア大学が、AlphaFold 2 のプライベート トレーニング データの問題を解決するために 1,600 万個のタンパク質配列をオープンソース化しました。

>>: 

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

...

...

新しい形の人工知能が登場: AIaaSについてお話しましょう

「サービスとしての」配信モデルの誕生以来、SaaS と PaaS は日常的な技術用語の一部となり、企...

...

Dry goods: アルゴリズムの学習に役立つオープンソース プロジェクト

[[321744]]今日、LeetCode の問題やさまざまなアルゴリズム ルーチンを分析できる優れ...

人工知能による仕事の代替

テスラとペイパルの創業者イーロン・マスク氏は、将来私たちのほとんどが職を失うとさえ言っており、人工知...

...

次世代人工知能の開発方向(第1部)

[[349500]]人工知能は半世紀以上前から存在していますが、人工知能の分野は過去 10 年間で...

文脈学習 = 対照学習?人民大学が ICL 推論の背後にある暗黙の更新メカニズムを明らかに: 勾配は更新されるのか? 「さらに」

近年、Transformer に基づく大規模言語モデルは、驚くべきコンテキスト内学習 (ICL) 機...

JVMシリーズ(3):GCアルゴリズムガベージコレクター

[[204469]]概要ガベージコレクションは、通常「GC」と呼ばれます。1960年にMITのLis...

研究AI面接に合格するには? RedditユーザーがGoogleの面接体験を語る

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

データ構造とアルゴリズム: 最小全域木、数秒で理解できます!

[[426679]]序文データ構造とアルゴリズムのグラフ理論において、最小全域木アルゴリズムは、比...

...

Reddit で話題: 言葉では言い表せない写真に透かしを追加することに特化したアプリが AI によって解読されました!

ベルギーの通信会社は、10代の若者向けに「.comdom」というセキュリティアプリをリリースした。こ...

この記事では、ロボットが視覚を通じてターゲット追跡を実現する方法を説明します。

概要: 視覚追跡技術は、コンピュータービジョン(人工知能の一分野)の分野における重要なトピックであり...