10月27日、外国メディアは、人工知能企業Jina AIがこのほど、第2世代のテキスト埋め込みモデル「Jina-embeddings-v2」のリリースを発表したと報じた。このオープンソース モデルは 8K (8192 トークン) のコンテキスト長をサポートしており、Massive Text Embedding Benchmark (MTEB) のリーダーボードと機能の点で、OpenAI の独自モデル text-embedding-ad-002 と直接競合します。 jina-embedding-v2 が分類平均、再ランキング平均、検索平均、集約平均で OpenAI を上回っていることは注目に値します。 jina-embeddings-v2 は、徹底的な研究開発、データ収集、微調整を経て、慎重にゼロから構築されています。その結果、前モデルから大きく進歩したモデルが誕生しました。 技術的な成果に加えて、jina-embeddings-v2 の 8K コンテキスト長は、法的文書分析、医療研究、文学分析、財務予測、会話型 AI など、さまざまな業界のアプリケーションに新たな扉を開きます。ベンチマーク テストでは、この拡張コンテキストにより、jina-embettings-v2 がいくつかのデータセットで他の主要な基本埋め込みモデルよりも優れたパフォーマンスを発揮することが示され、より長いコンテキスト機能の実際的な利点が強調されています。 Jina AIは、「Jina-embeddings-v2」の技術的な複雑さとベンチマークを詳述した学術論文を発表し、OpenAIと同様の埋め込みAPIプラットフォームを開発し、ドイツと英国のモデルを立ち上げる予定です。 |
<<: GoogleはOpenAIの競合企業Anthropicに最大20億ドルを投資することに同意したと報じられている
年末には給与に関する議論が再び盛り上がる。昨日、馬化騰氏は抽選で従業員に30万元相当のテンセント株1...
ティム・アンダーソン編纂者:ヤン・ジェン制作:51CTO テクノロジースタック(WeChat ID:...
C# アルゴリズムは張さんの誕生日問題をどのように実装するのでしょうか?まず、張さんの誕生日に関する...
スマートヘルスケアで使われる主なAI技術は画像とデータ分析機能ですが、その応用範囲は次の6つを含めて...
人々の生活の重要な分野として、医療産業の発展は大きな注目を集めています。現在、医師の診察の難しさや高...
人工知能とデータサイエンスは、2023 年に最もエキサイティングで影響力のある 2 つのテクノロジー...
これまで、私たちは人工知能が医療業界にどのように貢献するかについて議論してきました。新型コロナウイル...
[[435206]]近年、ディープニューラルネットワークは多くの科学技術上の問題において優れたパフ...
海外メディアの報道によると、ロボットは多くのスポーツや活動で優れているが、1つのタスクだけを実行する...
この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...