スクリーンショットからiPhoneアプリを生成し、コードに変換し、ウェブサイトを作成できます。アップグレード後、Google Bardは本当に

スクリーンショットからiPhoneアプリを生成し、コードに変換し、ウェブサイトを作成できます。アップグレード後、Google Bardは本当に

2日前、GoogleのChatGPTに似た製品Bardが大規模なアップデートを受け、画像認識機能など多くの要望の多かった新機能が追加され、「史上最大のアップグレード」と称されました。

画像認識機能により、Bard はチャットに挿入された画像を解釈し、画像の内容に関する詳細情報を識別し、画像に基づいてキャプションを生成するなどの処理を行うことができます。 Bard は、マルチモーダル アップグレードを通じて ChatGPT のゲームのルールを変えたと言えます。

写真

今週末、Bard を待ち望んでいる開発者は、Google Bard を使用してさまざまな興味深いアプリケーションを作成することを待ちきれません。

開発者は Bard を使って具体的に何ができるのか、疑問に思わずにはいられません。 Twitter ブロガーの @minchoi が、いくつかの素晴らしい Bard の使用事例をまとめました。さらに、Synced は他の興味深い使用例もいくつかまとめています。簡単に見てみましょう。

写真

スケッチがジョークサイトになった

画像出典: Twitter @dr_cintas

Google Bard のアップデートはすごいです。誰かがナプキンに描いたスケッチからウェブサイトを作成し、きっかけが必要でした。

詳細な手順は次のとおりです。

まず、Bard の Web サイトにアクセスし、+ をクリックしてスケッチ画像を追加し、プロンプトを記述します。ここでのプロンプトは、「元のコンテンツを 2 つの本物のジョークに置き換えたカラフルな Web サイトに変換する短い HTML/JS を記述する」ことです。

写真

現時点では期待した結果が得られない可能性があります。 「他のドラフトを表示」をクリックすると、Bard はさらに 2 つのオプションを提供するか、出力を再生成します。特定の何かを変更したい場合は、2 番目のプロンプトでそれを要求してください。色の変更のリクエストです。

写真

次に、実行するために、HTML コードをテキスト エディター (またはテキスト ファイル) にコピーし、[something].html という名前を付けます。このようにして、最終的な Web サイトとジョークの結末が完成します。

写真

1枚のスクリーンショットからiPhoneアプリを作成する

画像出典: Twitter @ammaar

それが十分衝撃的ではないと思うなら、もっとハードコアなものを試してください。 Google Bard を使用すると、スクリーンショットだけで 4 分以内に基本的なタイマー アプリを再現した人がいます。

さらに、アプリケーションが何をすべきかについてのヒントを Bard に与える必要はなく、Bard がすべてのコードを提供するだけです。いくつかのエラーがありましたが、バードは時間内にそれらを修正することができました。

完全な作成プロセスについては、以下のビデオで説明されています。

このBardの素晴らしい使い方について、一部のネットユーザーからは、GPT-4がリリースされたときに、ウェブサイトのUIを描画したりAIコーディングを行ったりするデモを見たことがあるという声が上がっていました。今回、Bard は、アプリや Web サイトを作成したいが、UI 全体を説明したくない (単にスケッチしたり Figma で作成したりしたい) 非技術者向けに、多くの興味深いアイデアを提供しています。

同様の例はたくさんあります。たとえば、画像を非常に高速に実行されるコードに変換する人もいます。

画像出典: Twitter @Yampeleg

より洗練された専門のパーソナルアシスタント

パーソナル アシスタントは、大規模な会話モデルの主要な使用例であり、Google Bard はより正確で特化しています。

ブロガーの@minchoiは、バード氏を経費管理アシスタントとして訓練した。詳細な手順は次のとおりです。

ステップ 1: 次のプロンプトを使用します。「あなたには私の出張経費を整理するパーソナル アシスタントとして働いてもらいたいです。一連の画像を提供し、経費報告書に必要なすべての情報 (日付、時刻、カテゴリ、説明、税込みの合計金額) とともに表にまとめてほしいです。領収書がなくなったら、「完了しました」と伝えます。」フォームのタイトルは「経費報告書」です。

ステップ 2: 領収書を Bard に渡します。携帯電話でレシートの写真を撮り、Bard にレシート <番号> (レシート 1、レシート 2 など) を伝えます。 Bard が情報を正確に抽出できるように、写真が鮮明であることを確認してください。 Bard はテキストをかなり正確に抽出できますが、情報が正しいことを必ず確認してください。

ステップ 3: すべての領収書を追加したら、「完了しました」と入力します。バードはすべての情報を表にまとめます。

ステップ 4: Bard にエクスポート レポートを生成するように指示します。データを Google スプレッドシートにエクスポートして経費レポートを作成することも可能です。

写真から完全なレシピを入手

画像出典: Twitter @rowancheung

大きなダイアログ モデルが食事のレシピを提供するというのは新しい機能ではありませんが、今回の Bard は明らかに異なります。

ある人が最近食べた食事の写真をアップロードし、バードに詳しいレシピを尋ねました。

結果は驚くべきもので、バードは手順を記した非常に正確なレシピを提供しました。これは、バードのマルチモーダル機能がさらに一歩進んで、論理的推論能力を使用していることを意味します。

その他のユースケース

コードを説明する

Bard はユーザーのコードを 1 行ずつ解釈できるようになり、コード生成、コードのデバッグ、解釈などのプログラミングおよびソフトウェア開発タスクを支援します。

OCRテキスト認識

Bard は、請求書からテキストを抽出し、その情報を美しい表にまとめることができるようになりました。

診断用脳CT画像

バード氏はCTスキャンから得た自身の診断結果を発表したが、それは脳腫瘍、脳卒中、脳出血、あるいはその他の病気の可能性もあった。

画像出典: Twitter @CeoImed

開発者の経験が増え続けるにつれて、将来的には Google Bard のより興味深く本格的な使用例が発見されるようになると信じています。

<<:  1.9k の星を獲得した LLM 微調整ツール Lamini は高速かつ強力で、無料で利用可能

>>:  AIは製造業にどのように役立つのでしょうか?

推薦する

顔認識の急速な発展は落ち着くはずだ

[[283549]] Xipo/Textいつから始まったのかは分かりませんが、顔認証が普及し、「顔認...

宮崎駿のアニメで新垣結衣を見たことがありますか?このオープンソースのアニメジェネレーターは、写真を数秒で手描きの日本のアニメに変換します

写真を撮るだけで、宮崎駿や新海誠などの日本のアニメ巨匠の手描き風に変換できます。アニメ画像を生成する...

...

AIは人類にとって脅威でしょうか?人工知能には強いものと弱いものがあるが、本当の危険は強い人工知能である

近年、科学技術分野で最もホットな言葉は人工知能であり、これは近年の人工知能の急速な発展によるものです...

DeepMind: 畳み込みネットワークは ViT ほど優れていないと誰が言ったのですか?

ディープラーニングの初期の成功は、畳み込みニューラル ネットワーク (ConvNet) の開発による...

百度の于有平氏:すべての開発者が平等かつ便利にAI機能にアクセスできるようにする

「すべての開発者が平等かつ便利にAI機能にアクセスできるようにするのが、私たちのビジョンであり、コミ...

行列の乗算は乗算を必要とせず、100倍高速化、MITが近似アルゴリズムをオープンソース化

[[421266]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

自然言語処理におけるAIの未来を探る

自然言語処理 (NLP) 機能の向上により、認知機能と人間同士のやり取りが向上し、それが AI の将...

自動運転車の長所と短所

長年にわたる技術の進歩により、交通はより便利になりました。 IoT アプリケーションなどの自動車技術...

AIはデータセキュリティをどう変えるのか

サイバーセキュリティにおける人工知能 (AI) は、データセキュリティにとって良いものでしょうか、そ...