OpenAIと競合しますか? Jina AI、オープンソースの8Kテキスト埋め込みモデルを発表

OpenAIと競合しますか? Jina AI、オープンソースの8Kテキスト埋め込みモデルを発表

10月27日、外国メディアは、人工知能企業Jina AIがこのほど、第2世代のテキスト埋め込みモデル「Jina-embeddings-v2」のリリースを発表したと報じた。このオープンソース モデルは 8K (8192 トークン) のコンテキスト長をサポートしており、Massive Text Embedding Benchmark (MTEB) のリーダーボードと機能の点で、OpenAI の独自モデル text-embedding-ad-002 と直接競合します。

jina-embedding-v2 が分類平均、再ランキング平均、検索平均、集約平均で OpenAI を上回っていることは注目に値します。

jina-embeddings-v2 は、徹底的な研究開発、データ収集、微調整を経て、慎重にゼロから構築されています。その結果、前モデルから大きく進歩したモデルが誕生しました。

技術的な成果に加えて、jina-embeddings-v2 の 8K コンテキスト長は、法的文書分析、医療研究、文学分析、財務予測、会話型 AI など、さまざまな業界のアプリケーションに新たな扉を開きます。ベンチマーク テストでは、この拡張コンテキストにより、jina-embettings-v2 がいくつかのデータセットで他の主要な基本埋め込みモデルよりも優れたパフォーマンスを発揮することが示され、より長いコンテキスト機能の実際的な利点が強調されています。

Jina AIは、「Jina-embeddings-v2」の技術的な複雑さとベンチマークを詳述した学術論文を発表し、OpenAIと同様の埋め込みAPIプラットフォームを開発し、ドイツと英国のモデルを立ち上げる予定です。

<<:  GoogleはOpenAIの競合企業Anthropicに最大20億ドルを投資することに同意したと報じられている

>>: 

ブログ    
ブログ    

推薦する

AIの価値を実現する上での5つの障壁とその克服方法

BCGとガートナーの専門家は、AIの試験はすでに大規模になっているが、導入から価値を引き出すのは依然...

企業がAI対応データベースを使用してAI導入を加速する方法

企業は、AI を搭載し、AI 向けに構築されたデータベースを検討する必要があります。最適化と使いやす...

ByteDance、検索速度が8倍に高速化した最新の音楽検索システム「ByteCover2」をリリース

最近、ByteDance Volcano Voice Teamの最新の音楽検索システムであるByte...

効果よりも研究が重要です。バイオニックロボットはどうすれば実用化できるのでしょうか?

[[235506]]映画『ウォーリー』では、愛らしいウォーリー(WALL-E、廃棄物処理ロボット地...

Google翻訳では対応できない?ドイツ語ハードコア翻訳DeepL体験

[[321121]]インターネットを頻繁に利用する人のほとんどは、お気に入りの翻訳ツールを持っていま...

求職者は偽者でしょうか?詐欺師はディープフェイクを使って身元を盗み、遠隔地の仕事に応募する。FBI:話すときに識別できる

​ビッグデータダイジェスト制作著者: カレブオンラインでの仕事は徐々に私たちの生活に入り込んできてい...

FFH—AI 詩作 HttpRequest 練習

オープンソースの詳細については、以下をご覧ください。 51CTO オープンソース基本ソフトウェアコミ...

...

AI のブラックボックスを開く: 「説明可能な」人工知能 (XAI) への認知ガイド!

今日、企業組織は意思決定に人工知能や機械学習モデルをますます頼りにしており、こうした意思決定は私たち...

...

...

責任ある AI 導入: IT 共生の青写真

AI ツールが合法化され、職場に導入されるようになると、人々は当然、その使用例や AI ツールに依存...

...

医学物理学におけるAIの応用に関する簡単な分析

近年、バイオメディカルにおける人工知能 (AI) と機械学習 (ML) アルゴリズムの応用は拡大し続...