金融、気象、エネルギーなどのさまざまな業界では、毎日大量の異種データが生成されます。人々は、このデータを効果的に管理、処理、表示するためのツールを緊急に必要としています。 最近、浙江大学は、大規模言語モデル(LLM)を展開することで、大量のデータを自律的に管理・処理するDataCopilotを提案しました。つまり、さまざまな分野の豊富なデータを結び付けて、ユーザーの多様なクエリ、計算、予測、視覚化などのニーズを満たします。 リポジトリ: https://github.com/zwq2018/Data-Copilot アルクシブ: https://arxiv.org/abs/2306.07209 デモ: https://huggingface.co/spaces/zwq2018/Data-Copilot DataCopilot に表示するデータを伝えるには、テキストを入力するだけです。面倒な操作や自分でコードを記述する必要はありません。DataCopilot は、人間の支援なしに、データの検索、データの処理、データの分析、画像の描画を自律的に支援できるため、生データをユーザーの意図に最も合った視覚化結果に自律的に変換します。 写真 多くの研究で LLM の可能性が探究されてきました。たとえば、Sheet-Copilot、Visual ChatGPT、Audio GPT は、LLM を使用して、データ分析、ビデオ編集、音声変換のための視覚と音声の分野のツールを呼び出します。データ サイエンスの観点から見ると、表、視覚化、オーディオはすべてデータの形式と見なすことができ、これらすべてのタスクはデータ関連のタスクと見なすことができます。したがって、新たな疑問が生じます。一般的なデータのコンテキストでは、LLM はさまざまなデータ関連のタスクを処理するための自動化されたデータ サイエンス ワークフローを構築できるでしょうか?この目標を達成するには、いくつかの課題に対処する必要があります。
したがって、データ関連のタスクをカバーする一般的なフレームワークを実現するために、この研究では Data-Copilot を提案します。 写真 Data-Copilot は、数十億のデータと多様なユーザーのニーズを結び付け、データ関連のタスクを処理する LLM ベースのシステムです。データを効率的に管理、呼び出し、処理、視覚化するためのインターフェース ツールを独自に設計します。複雑なリクエストを受信すると、Data-Copilot はこれらの自己設計インターフェースを自律的に呼び出し、ユーザーの意図を満たすワークフローを構築します。人間の支援なしに、さまざまなソースからさまざまな形式の生データをグラフ、表、テキストなどの人間が理解しやすい出力に巧みに変換できます。 主な貢献
主な方法Data-Copilot は、インターフェース設計とインターフェース スケジューリングという 2 つの主要な段階を持つ一般的な大規模言語モデル システムです。
Data-Copilot は、リクエストを自動的に生成し、インターフェイスを独立して設計することで、高度に自動化されたデータ処理と視覚化を実現し、ユーザーのニーズを満たし、結果をさまざまな形式でユーザーに提示します。 写真 インターフェースデザイン 上図に示すように、まずデータ管理を実装する必要があり、最初のステップではインターフェース ツールが必要です。 Data-Copilot は、データ管理ツールとして多数のインターフェースを設計しました。インターフェースは、自然言語 (機能記述) とコード (実装) で構成されるモジュールであり、データの取得や処理などのタスクを担当します。
以下に示すように、データ処理には Data-Copilot 独自のインターフェース ツールが使用されます。 写真 インターフェースのスケジューリング 前の段階では、データの取得、処理、視覚化のためのさまざまな共通インターフェース ツールを取得しました。各インターフェースには明確で具体的な機能説明があります。上記の 2 つのクエリ例に示されているように、Data-Copilot は、リアルタイムのリクエストでさまざまなインターフェースを計画して呼び出すことで、データから複数の形式の結果までのワークフローを形成します。
Data-Copilot は、インターフェースの説明と例に従って、各ステップ内でインターフェースのスケジュールを順次または並行して調整します。 次の例に示すように: Data-Copilot は、次のワークフローを独自に設計しました。 写真 この複雑な問題に対処するために、Data-Copilot は loop_rank インターフェースを使用して複数のループ クエリを実装します。 最後に、実行後のワークフローの結果は次のようになります。 写真 横軸は各構成銘柄名、縦軸は第1四半期純利益の前年同期比成長率です。 実験結果予測ワークフロー 写真 展開ワークフロー: 過去の GDP データを取得する ----> 線形回帰モデルを使用して将来を予測する -----> テーブルを出力する 写真 並列ワークフロー 写真 写真 写真 結論はこの研究では、さまざまなデータ関連のタスクを処理するための一般的なフレームワークである Data-Copilot が提案されました。多数の異種データと人間との間の橋渡しとして機能し、人間の好みに応じてデータを効果的に管理、処理、表示します。 Data-Copilot は、データ関連タスクのあらゆる段階に LLM を統合し、ユーザーの要求に基づいて生データをユーザーフレンドリーな視覚化結果に自動的に変換し、面倒な労力と専門知識への依存を大幅に軽減します。 Data-Copilot は、経験豊富な専門家のように、さまざまな種類のデータや潜在的なユーザーのニーズに適した共通のインターフェース ツールを独自に設計し、これらのインターフェースをリアルタイムで呼び出して、ユーザーの要求に対する明確なワークフローを展開します。インターフェース設計とスケジュール設定の 2 つのプロセスは Data-Copilot によって完全に制御され、人間の介入はほとんど必要ありません。 この研究は、株式、ファンド、経済、企業財務、リアルタイムニュースに関連する複雑な要求に柔軟に対応できる、信頼できる人工知能アシスタントである、中国金融版のData-Copilotを提供します。 |
>>: 論文のイラストは拡散モデルを使用して自動的に生成することもでき、ICLRに受け入れられました。
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
新たなスタープロジェクトが誕生! AI 開発者コンパニオンである GPT Pilot を使用すると、...
[51CTO.comより引用] 2019年を振り返ると、今年は人工知能、モノのインターネット、クラ...
著者 | 崔昊レビュー | Chonglou一般的なモデルは優れていますが、技術者は、独自の大規模な...
[[336572]]この記事では、H2o.ai フレームワークを使用した機械学習を使用して R 言語...
遺伝的アルゴリズムはランダムなグローバル最適化アルゴリズムです。人工ニューラル ネットワークと並んで...
今日、AI プログラムは、写真やビデオ内の顔や物体を認識し、音声をリアルタイムで書き起こし、X 線ス...
AI と IoT が広く使用されるようになるにつれて、これら 2 つのテクノロジーがどのように連携し...
1. Transformer 大規模言語モデルのための SOTA トレーニング技術1. 大規模言語モ...
2016年3月、人間と機械の戦い「イ・セドル対AlphaGo」は、人工知能の力を世界に知らしめた。...
Microsoft は、Windows 365 を通じて、ますます多くの Windows 機能とコン...
2020年5月、GPT-3はGPT-2のリリースから1年後に正式にリリースされました。GPT-2も...
グラフは、複雑なシステムを記述およびモデル化するために使用できる一般的な言語です。グラフは、構文情報...
[[387145]]基本的な紹介1. スタックはFILO(先入れ後出し)順序付きリストです2. ス...