10月27日、外国メディアは、人工知能企業Jina AIがこのほど、第2世代のテキスト埋め込みモデル「Jina-embeddings-v2」のリリースを発表したと報じた。このオープンソース モデルは 8K (8192 トークン) のコンテキスト長をサポートしており、Massive Text Embedding Benchmark (MTEB) のリーダーボードと機能の点で、OpenAI の独自モデル text-embedding-ad-002 と直接競合します。 jina-embedding-v2 が分類平均、再ランキング平均、検索平均、集約平均で OpenAI を上回っていることは注目に値します。 jina-embeddings-v2 は、徹底的な研究開発、データ収集、微調整を経て、慎重にゼロから構築されています。その結果、前モデルから大きく進歩したモデルが誕生しました。 技術的な成果に加えて、jina-embeddings-v2 の 8K コンテキスト長は、法的文書分析、医療研究、文学分析、財務予測、会話型 AI など、さまざまな業界のアプリケーションに新たな扉を開きます。ベンチマーク テストでは、この拡張コンテキストにより、jina-embettings-v2 がいくつかのデータセットで他の主要な基本埋め込みモデルよりも優れたパフォーマンスを発揮することが示され、より長いコンテキスト機能の実際的な利点が強調されています。 Jina AIは、「Jina-embeddings-v2」の技術的な複雑さとベンチマークを詳述した学術論文を発表し、OpenAIと同様の埋め込みAPIプラットフォームを開発し、ドイツと英国のモデルを立ち上げる予定です。 |
<<: GoogleはOpenAIの競合企業Anthropicに最大20億ドルを投資することに同意したと報じられている
BCGとガートナーの専門家は、AIの試験はすでに大規模になっているが、導入から価値を引き出すのは依然...
企業は、AI を搭載し、AI 向けに構築されたデータベースを検討する必要があります。最適化と使いやす...
最近、ByteDance Volcano Voice Teamの最新の音楽検索システムであるByte...
[[235506]]映画『ウォーリー』では、愛らしいウォーリー(WALL-E、廃棄物処理ロボット地...
[[321121]]インターネットを頻繁に利用する人のほとんどは、お気に入りの翻訳ツールを持っていま...
ビッグデータダイジェスト制作著者: カレブオンラインでの仕事は徐々に私たちの生活に入り込んできてい...
オープンソースの詳細については、以下をご覧ください。 51CTO オープンソース基本ソフトウェアコミ...
AnimateAnyoneに続き、Alibabaのもう一つの「ダンス作品」論文が人気を集めている—...
今日、企業組織は意思決定に人工知能や機械学習モデルをますます頼りにしており、こうした意思決定は私たち...
AI ツールが合法化され、職場に導入されるようになると、人々は当然、その使用例や AI ツールに依存...
近年、バイオメディカルにおける人工知能 (AI) と機械学習 (ML) アルゴリズムの応用は拡大し続...