10月27日、外国メディアは、人工知能企業Jina AIがこのほど、第2世代のテキスト埋め込みモデル「Jina-embeddings-v2」のリリースを発表したと報じた。このオープンソース モデルは 8K (8192 トークン) のコンテキスト長をサポートしており、Massive Text Embedding Benchmark (MTEB) のリーダーボードと機能の点で、OpenAI の独自モデル text-embedding-ad-002 と直接競合します。 jina-embedding-v2 が分類平均、再ランキング平均、検索平均、集約平均で OpenAI を上回っていることは注目に値します。 jina-embeddings-v2 は、徹底的な研究開発、データ収集、微調整を経て、慎重にゼロから構築されています。その結果、前モデルから大きく進歩したモデルが誕生しました。 技術的な成果に加えて、jina-embeddings-v2 の 8K コンテキスト長は、法的文書分析、医療研究、文学分析、財務予測、会話型 AI など、さまざまな業界のアプリケーションに新たな扉を開きます。ベンチマーク テストでは、この拡張コンテキストにより、jina-embettings-v2 がいくつかのデータセットで他の主要な基本埋め込みモデルよりも優れたパフォーマンスを発揮することが示され、より長いコンテキスト機能の実際的な利点が強調されています。 Jina AIは、「Jina-embeddings-v2」の技術的な複雑さとベンチマークを詳述した学術論文を発表し、OpenAIと同様の埋め込みAPIプラットフォームを開発し、ドイツと英国のモデルを立ち上げる予定です。 |
<<: GoogleはOpenAIの競合企業Anthropicに最大20億ドルを投資することに同意したと報じられている
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[194770]]私はずっと、人工知能がどのように提案されたのか、その背後にはどのような物語がある...
プルーフ・オブ・ワーク最も一般的なブロックチェーンのコンセンサス アルゴリズムは、ビットコインのプル...
Transformer は最近、さまざまな視覚タスクで優れたパフォーマンスを発揮しており、受容野によ...
現在 3 つの異なるサイズで提供されているこれらのモデルは、リソースの少ない言語を含む 600 以上...
エッジ コンピューティングは、急成長しているモノのインターネットの成長に不可欠です。最近、機械学習と...
最近、face_recognitionという顔認識プロジェクトがGitHubのトレンドリストに掲載さ...
問題を解決するには、説明するのではなく検証する[[284237]]多くの IoT プロジェクトの提示...
数日前、私は「チャットボットをよりエレガントに設計する方法」という記事を書きました。何人かの友人が私...
「暗闇が私たちの光を引き立てる/そして私は漠然とした幻想しか見ることができない/孤独の瞬間のあなた...
4月1日早朝のニュース:3月初旬から、AppleはAppランキングアルゴリズムを徐々に調整し、ランキ...
研究者らは、過去の衝突データ、道路地図、衛星画像、GPS に基づいてディープ モデルをトレーニングし...
突然、大規模なモデリングコミュニティ全体が同じことについて話すようになりました。マイクロソフトの論文...