翻訳者 |陳俊 レビュー | Chonglou この記事では、「少量学習」の概念を紹介し、テキスト分類で広く使用されているSetFit法に焦点を当てます。 従来の機械学習 (ML)教師あり機械学習では、正確な予測を行う能力を磨くために、大規模なデータセットを使用してモデルをトレーニングします。トレーニングプロセスが完了したら、テストデータを使用してモデルの予測結果を取得できます。しかし、この従来の教師あり学習アプローチには、エラーのない大量のトレーニング データ セットが必要になるという重大な欠点があります。しかし、すべての分野でこのようなエラーのないデータセットを提供できるわけではありません。そこで、「少数サンプル学習」という概念が生まれました。 Sentence Transformer の微調整( SetFit )について詳しく説明する前に、自然言語処理 ( NLP )の重要な側面である「少量学習」について簡単に確認しておく必要があります。 少数ショット学習少数ショット学習とは、限られたトレーニング データ セットを使用してモデルをトレーニングすることを意味します。モデルは、サポート セットと呼ばれるこれらの小さなセットから知識を獲得できます。このタイプの学習は、トレーニング データ内の類似点と相違点を識別するために、少数ショット モデルを学習させることを目的としています。たとえば、モデルに特定の画像を猫か犬に分類するように指示するのではなく、さまざまな動物の共通点と相違点を理解するように指示します。ご覧のとおり、このアプローチは入力データの類似点と相違点を理解することに重点を置いています。そのため、メタ学習や学習のための学習とも呼ばれます。 少数ショット学習のサポート セットは、 k方向nショット学習とも呼ばれることに留意してください。ここで、「 k 」はサポートセット内のカテゴリの数を表します。たとえば、バイナリ分類では、 kは2に等しくなります。一方、「 n 」はサポート セット内の各クラスで利用可能なサンプルの数を表します。たとえば、陽性クラスに10 個のデータ ポイントがあり、陰性クラスに10 個のデータ ポイントがある場合、 n は10になります。要約すると、このサポート セットは双方向の10ショット学習として説明できます。 少数ショット学習の基本を理解したので、 SetFit の使用方法を簡単に学習し、それを e コマース データセットのテキスト分類に適用してみましょう。 SetFitアーキテクチャHugging Faceと Intel Labs のチームが共同で開発したSetFit は、少数ショットの写真分類用のオープンソース ツールです。 SetFit に関する包括的な情報は、プロジェクト リポジトリ リンク (https://github.com/huggingface/setfit?ref=hackernoon.com) で参照できます。 出力の場合、 SetFit は顧客レビュー ( CR ) 感情分析データセットからカテゴリごとに 8 つの注釈付き例のみを使用します。結果は、3,000 個の例の完全なトレーニング セットで微調整されたRoBERTa Largeの結果に匹敵します。サイズの点では、わずかに最適化されたRoBERTaモデルはSetFitモデルの 3 倍の大きさであることは強調する価値があります。次の図は SetFit アーキテクチャを示しています。 画像ソース: https://www.sbert.net/docs/training/overview.html?ref=hackernoon.com SetFitによる高速学習SetFitのトレーニング速度は非常に速く、効率的です。 GPT-3やT-FEWなどの大型モデルと比較しても、その性能は非常に競争力があります。次の図を参照してください。 SetFitとT-Few 3Bモデルの比較 下の図に示すように、 SetFit は、Few-Shot 学習においてRoBERTaよりも優れています。 SetFit と RoBERT の比較、画像ソース: https://huggingface.co/blog/setfit?ref=hackernoon.com データセット以下では、書籍、アパレルとアクセサリー、電子機器、家庭用品の 4 つの異なるカテゴリで構成される独自の e コマース データセットを使用します。このデータセットの主な目的は、電子商取引 Web サイトの製品説明を指定されたラベルに分類することです。 少数ショットのトレーニング アプローチを容易にするために、4 つのカテゴリのそれぞれから 8 つのサンプルを選択し、合計32 個のトレーニング サンプルを作成します。残りのサンプルはテスト用に保管されます。簡単に言うと、ここで使用するサポート セットは4 ~ 8ショットの学習です。次の図は、カスタム e コマース データセットの例を示しています。 カスタム e コマース データセット サンプル テキストデータをさまざまなベクトル埋め込みに変換するために、 「 all-mpnet-base-v2 」というSentence Transformersの事前トレーニング済みモデルを採用しています。このモデルは、入力テキストに対して768次元のベクトル埋め込みを生成できます。 以下のコマンドに示すように、 conda環境 (オープンソースのパッケージ管理システムおよび環境管理システム)に必要なパッケージをインストールして、 SetFitの実装を開始します。 パッケージをインストールしたら、次のコードを使用してデータセットを読み込むことができます。 トレーニングサンプルとテストサンプルの数を確認するには、下の図を参照してください。 トレーニングおよびテストデータ テキスト ラベルをエンコードされたラベルに変換するには、 sklearnパッケージのLabelEncoderを使用します。 LabelEncoderを使用して、トレーニング データセットとテスト データセットをエンコードし、エンコードされたラベルをデータセットの「ラベル」列に追加します。次のコードを参照してください: 次に、 SetFitモデルと sentence-transformers モデルを初期化します。 両方のモデルを初期化したら、トレーニング手順を呼び出すことができます。 2 回のトレーニング エポックを完了したら、 eval_datasetでトレーニング済みモデルを評価します。 テストの結果、トレーニング済みモデルの最高精度は87.5%でした。 87.5%という精度は高くありませんが、結局のところ、私たちのモデルはトレーニングに32 個のサンプルしか使用しませんでした。つまり、データセットのサイズが限られていることを考慮すると、テスト データセットで87.5%の精度を達成することは、実はかなり印象的です。 さらに、 SetFit はトレーニング済みのモデルをローカル ストレージに保存し、後でディスクからロードして将来の予測に使用することもできます。 次のコードは、新しいデータに基づく予測結果を示しています。 予測出力は 1 であり、ラベルのLabelEncoded値は「衣類とアクセサリー」であることがわかります。従来の AI モデルでは、安定したレベルの出力を実現するために、大量のトレーニング リソース (時間とデータを含む) が必要になります。それらと比較すると、私たちのモデルは正確かつ効率的です。 この時点で、基本的には「少量学習」の概念と、テキスト分類などのアプリケーションでSetFit を使用する方法を習得できたと思います。もちろん、より深い理解を得るためには、実際のシナリオを選択し、データセットを作成し、対応するコードを記述し、プロセスをゼロショット学習とワンショット学習に拡張することを強くお勧めします。 翻訳者紹介51CTO コミュニティの編集者である Julian Chen 氏は、IT プロジェクトの実装で 10 年以上の経験があります。社内外のリソースとリスクの管理に長けており、ネットワークと情報セキュリティの知識と経験の普及に重点を置いています。 原題:テキスト分類のための SetFit による Few-Shot 学習の習得、著者: Shyam Ganesh S) |
業界に「金儲けの見込み」があれば、必然的に「混乱」が起こります。 10年前はスマートフォンでしたが、...
ディープラーニング技術の成熟に伴い、AIは最先端技術から徐々に普及しつつあります。最先端のテクノロジ...
[[357814]]これを読んでいるあなたは、目の前のウェブサイトから CT スキャンの読み取りまで...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
人工知能の革新により、ツールの使用方法は変化しています。 AI 学習アプリケーションは、適応型学習、...
パデュー大学のデジタルツインラボの最新の成果として、研究者らは、大規模言語モデル (LLM) を使用...
Andrew Ng 氏は、Tess Ferrandez 氏が修了したディープラーニング特別コースのイ...
1 「急に悲しくなりました。私のハンサムな顔の価値はたったの50セントだったんです!」昨日、あるニュ...
[[440343]] MIT-IBM Watson AI Labの主任科学者であるガン・チュアン氏...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
生成 AI により、機械はコンテンツを作成し、人間の行動を模倣し、創造的な仕事に貢献できるようになり...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...
人工知能が詩と連句を作曲、神経医学人工知能研究の最新の進歩、人工知能交通融合認識とデジタルツインソリ...