10月27日、外国メディアは、人工知能企業Jina AIがこのほど、第2世代のテキスト埋め込みモデル「Jina-embeddings-v2」のリリースを発表したと報じた。このオープンソース モデルは 8K (8192 トークン) のコンテキスト長をサポートしており、Massive Text Embedding Benchmark (MTEB) のリーダーボードと機能の点で、OpenAI の独自モデル text-embedding-ad-002 と直接競合します。 jina-embedding-v2 が分類平均、再ランキング平均、検索平均、集約平均で OpenAI を上回っていることは注目に値します。 jina-embeddings-v2 は、徹底的な研究開発、データ収集、微調整を経て、慎重にゼロから構築されています。その結果、前モデルから大きく進歩したモデルが誕生しました。 技術的な成果に加えて、jina-embeddings-v2 の 8K コンテキスト長は、法的文書分析、医療研究、文学分析、財務予測、会話型 AI など、さまざまな業界のアプリケーションに新たな扉を開きます。ベンチマーク テストでは、この拡張コンテキストにより、jina-embettings-v2 がいくつかのデータセットで他の主要な基本埋め込みモデルよりも優れたパフォーマンスを発揮することが示され、より長いコンテキスト機能の実際的な利点が強調されています。 Jina AIは、「Jina-embeddings-v2」の技術的な複雑さとベンチマークを詳述した学術論文を発表し、OpenAIと同様の埋め込みAPIプラットフォームを開発し、ドイツと英国のモデルを立ち上げる予定です。 |
<<: GoogleはOpenAIの競合企業Anthropicに最大20億ドルを投資することに同意したと報じられている
パスワードを安全に保護するための標準アルゴリズムである bcrypt アルゴリズムについて説明します...
制作:51CTO テクノロジースタック(WeChat ID:blog)深夜、OpenAI の最大のラ...
MIT の研究者チームは、人工知能の分野を初心者にとってよりアクセスしやすいものにするとともに、専門...
Google アシスタントのような AI アシスタントは、追加データや再トレーニングを必要とせずに、...
テンセントが最近テスラの株式5%を購入したというニュースは業界で大きな話題を呼び、人工知能(AI)分...
AI時代に注目すべき新たな変化は、テクノロジー大手がAIチップを独自に開発し始めたことだ。これは一...
新しい研究(ETH チューリッヒによる)では次のことがわかりました。大規模モデルの「人間による検索」...
3D AI生成は近年急速に発展しており、最新の作品の多くは文章・画像から高品質な3Dモデルを生成で...
Shopee は世界中の複数の市場にサービスを提供する電子商取引プラットフォームであり、消費者に、よ...
[[433085]]アルゴリズムは本質的に、1 つ以上の入力を受け入れ、内部計算とデータ操作を実行...