天一雲が大規模言語モデル微調整データコンテストで優勝しました!

天一雲が大規模言語モデル微調整データコンテストで優勝しました!

最近、天地FT-Data Rankerコンテストが終了し、天一クラウドインテリジェントエッジビジネスユニットのAIチーム(以下、天一クラウドAIチーム)は、大規模言語モデル(LLM)トレーニングデータ強化における優れた研究により、大規模言語モデル微調整データコンテスト-7Bモデルトラックで優勝しました

FT-Data Rankerコンペティションは、大規模言語モデル研究のためのデータ中心のコンペティションで、北京大学やHantecを含む著名な大学、研究機関、企業から約400の優秀なチームが参加しました。天一クラウドは激しい競争の中で際立っており、強力な技術革新能力を発揮しました。

データは、大規模言語モデル (LLM) の機能を構築する上で重要な役割を果たします。データセットのより優れた構築と処理は、大規模言語モデルの分野での研究の焦点となっています。このコンペティションの核心は、データセットの品質を独立して正確に評価・改善し、ベンチマーク主導のデータ開発プロセスの形成を加速し、大規模言語モデルのデータ処理能力を強化し、データ品質とデータ最適化に関する分野の理解を深めることです。このコンテストでは、微調整段階のデータに特に重点が置かれ、参加者は元のデータセットをクリーンアップ、フィルタリング、強化し、新しいデータセットを使用して特定のモデルを微調整し、テスト セットでパフォーマンスをランク付けする必要があります。

コンテストの総合選抜タスクでは、天一雲AIチームが独自にデータ処理フローを構築し、複数の文書重複除去と文字列フィルタリング演算子を使用して低品質の大規模なオリジナルコーパスを処理し、高品質のモデルトレーニングデータを取得しました。同時に、テキスト要約タスクでは、天一雲AIチームはパラダイム転送(Paradigm Transfer)とモデル能力蒸留(Distillation)の方法を革新的に採用し、生成モデルを使用してオリジナルコーパス内の質問と回答を要約データとして処理および移行し、モデルのランダム性を0に設定して、トレーニングデータを間接的に拡張しました。上記の方法と戦略に基づいて、チームは元のコーパスに基づいて豊富で多様なタスクトレーニングセットを構築し、モデルが競争タスクをよりよく学習して理解できるようにしました。この計画の革新性実用性は審査員から高く評価されました。

このコンテストでチームが使用した大規模言語モデルトレーニングデータ強化技術は、天一クラウドチームのモデル開発・制作業務で広く活用されています。例えば、天一クラウドの政務ビッグモデル「匯澤」の研究開発ではトレーニングデータ強化戦略とアルゴリズムを幅広く採用することで、モデルのさまざまな機能が向上しました。これにより、「匯澤」は包括的な政務知識、強力な意図理解能力、幅広い応用、安全性と信頼性などの利点を備え、政策相談、政務指導、12345席支援、スマートオフィスなどのシーンを効率的に強化し、都市ガバナンスのレベル向上に貢献します。

天一クラウドは今後も人工知能関連技術と実用化の革新を推進し、より包括的でインテリジェントな製品とサービスで数千の業界のデジタル変革を実現していきます。

<<:  word2vecの作者はイリヤらとの10年間の恨みを明かした。seq2seqも私のアイデアだった

>>:  OpenAIの公式プロンプトエンジニアリングガイド:ChatGPTはこのようにプレイできます

ブログ    

推薦する

アート業界におけるメタバースの探究

メタバースの概念がますます普及するにつれて、さまざまな業界がこの豊かな土地を探索し始めました。多くの...

Python でシンプルなニューラル ネットワークを作成する方法 (コード付き)

[[251984]]ニューラル ネットワークの仕組みを理解する最良の方法は、自分でニューラル ネッ...

実用的なヒント | 人工知能に変身するために習得すべき 8 つのニューラル ネットワーク

なぜ機械学習が必要なのでしょうか?機械学習は、人間が直接プログラムできない複雑な問題を解決できるため...

警告! 「リップリーディング」キーでデータを盗む、AIは本当に怖い

コンピューターに頼って悪者を即座に見つけることができれば素晴らしいのですが、問題は AI システムが...

投資管理と AI: 顧客関係と投資収益の向上

正直に言うと、顧客はおそらく、投資マネージャーが使用する高度な AI ツールを気にしていないでしょう...

Baidu Brain の「EasyDL Classic Edition」はあなたを魅了しました。実際の業界アプリケーションを手に入れましたか?

既存のビジネスやソリューションをベースに、企業は AI 機能を導入することで、どのようにすれば効率性...

OpenAIのチップ製造計画が明らかに!独自のAIチップを開発する計画があり、買収対象を検討中

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Hongmengユニバーサルカードメモリフリップゲームの開発の詳細な説明

1. はじめにワイルド カード フリップ ゲームでは、合計 8 つのまったく異なる画像を持つ 16 ...

世界の主要なテクノロジー企業は新型コロナウイルスとどう戦っているのか?

[[319653]]新型コロナウイルスは、ウイルス自体の急速な拡散という点だけでなく、ますます多く...

2021 年のテクノロジートレンドはどこに向かうのでしょうか? IEEEが答えを教えます

[[357471]]このほど、全人類に利益をもたらす科学技術の進歩を促進することに尽力している世界最...

...

...

はい、純粋なSQLクエリステートメントでニューラルネットワークを実装できます。

[[229220]]よく知られているように、SQL は、開発者が大量のデータに対して効率的な操作を...

機械学習アルゴリズムの基礎知識

利用できるアルゴリズムは多数あります。難しいのは、さまざまな種類の方法があり、それらの方法に拡張もあ...

Think2Drive: 自動運転のための初のモデルベース RL 手法 (上海交通大学)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...