Google アシスタントのような AI アシスタントは、追加データや再トレーニングを必要とせずに、新しいサービスをより適切にサポートするにはどうすればよいでしょうか? これは、ドメイン固有のパラメータを使用せずにサービス間でモデルを使用する方法を紹介した最近の研究で、Google の研究者が答えようとした質問です。 その一環として、研究チームは、タスク指向の対話コーパスとして公開されているものとしては最大の規模を誇るコーパス、スキーマガイド付き対話 (SGD) コーパスをリリースしました。
「今日のバーチャルアシスタントは、フライトの検索、近くのイベントや映画の検索、予約、ウェブからの情報の取得など、ユーザーがさまざまなタスクを実行するのに役立ちます」と、ソフトウェアエンジニアのAbhinav Rastogi氏とGoogle ResearchのエンジニアリングリーダーPranav Khaitan氏はブログ投稿に書いています。 「驚異的な進歩にもかかわらず、最先端のモデルでは適応性の課題が見落とされがちです。これは、仮想アシスタントが直面する規模と複雑さに見合う適切なデータセットが不足していることが一因です。」 このため、 SGD には、銀行業務やイベントからメディア、カレンダー、旅行、天気まで、17 のドメインのサービスとのやり取りを含む、人々と仮想アシスタント間の 18,000 件を超える注釈付き会話が含まれています。 ほとんどのドメインでは、データセットには複数の異なる API が含まれており、その多くは機能が重複していますが、さまざまなインターフェースが典型的な現実世界のシナリオを反映しています。評価セットにはトレーニング セットに含まれていないサービスが含まれており、主に API の変更や新しい API の追加に対するモデルの堅牢性を定量化するために使用されます。 前述のパターン ガイド アプローチでは、各サービスまたは API の自然言語記述とそれに関連する属性を活用して分散セマンティック表現を学習します。これは、対話システムへの追加入力として使用され、その後、単一のモデルとして実装されます。 研究チームによると、この統合モデルはGoogleのオープンソース会話状態追跡モデルの中核をなすもので、異なるサービスにおける類似概念間の共通知識表現を促進し、トレーニングデータにはなかった新しいサービスでの動作を可能にするという。 「このデータセットは、大規模な会話モデルを構築するための優れたベンチマークとなるだろうと信じている」とラストギ氏とカイタン氏は書いている。 「研究コミュニティがこれを会話型テクノロジーの進歩のために革新的な方法で活用してくれることに興奮し、期待しています。」 新しいデータセットとモデルのリリースは、Google の Coached Conversational Preference Elicitation (CCPE) と、2 人の間の 1 対 1 の会話のデータセットである Taskmaster-1 のオープンソース化に続くものです。 (前者には、映画の好みについての人々との会話が 500 件、合計 10,000 件、合計 12,000 件の会話が含まれていました。) Google はこれを、人間レベルのパフォーマンスを実現できる自然言語システムのモデリングに向けた一歩だと説明しています。 |
<<: 顔認証決済の登場:「決済戦争」の次なる激戦点となるか?
>>: AI ソフトウェアは教育分野にどのように役立つのでしょうか?
最近はテクノロジーがあらゆるところに存在し、それに伴って変化も起こっています。つまり、ビジネス戦略に...
人工知能が進歩するにつれて、AI ツールに対する需要も高まっています。特に GPT のような高度なツ...
Google の年末開発者特典が始まりました! Google Gemini のリリースから 1 週間...
映画「ヴェノム」を見たことがある友人なら、「シンビオート」が液体の形で現れることを知っているでしょう...
スタンフォード大学の呉嘉軍チームが『不思議の国のアリス』の傑作のAI版を制作!たった 1 つの画像ま...
5G の商用化が近づいており、通信事業者が 5G ベアラ ネットワークを構築するための時間はあまり残...
人工知能と機械学習が DevOps に新たな自動化機能をもたらすにつれて、これらのテクノロジーが組織...
マッキンゼーの「2022年世界産業用ロボット調査」によると、産業企業は世界的な労働力不足に対処するた...
誰もが独自の大規模モデルをアップグレードして反復し続けるにつれて、コンテキスト ウィンドウを処理する...
設立から2年を経て、マスク氏の有名な脳コンピューターインターフェース研究会社Neuralinkがつい...
スタンフォード大学のAI 100のAI Indexプロジェクトは、人工知能の活動と進歩を追跡し、人工...
データ駆動型進化的最適化とは何ですか? それは単なるデータ + 最適化アルゴリズムですか? データ駆...
[[223504]]現在、フロントエンド開発の自動化に対する最大の障壁はコンピューティング能力です...