20,000語の記事を処理できる、初の商用32kコンテキストオープンソースモデル「Giraffe」が登場

20,000語の記事を処理できる、初の商用32kコンテキストオープンソースモデル「Giraffe」が登場

注意メカニズムに依存する大規模言語モデル (LLM) は通常、トレーニング中に固定のコンテキスト長を使用します。これにより、モデルが処理できる入力シーケンスの長さに上限が設定されます。そのため、文脈の「長さの外挿」手法を探求する研究は数多くあります。

コンテキスト長の外挿とは、より短いコンテキスト長でトレーニングされた LLM を使用し、より長いコンテキスト長でさらにトレーニングすることなく、より長いコンテキスト長で評価することを指します。その中でも、ほとんどの研究は注意機構における位置符号化システムの変更に焦点を当てています。

現在、Abacus.AI の研究チームは、LLaMA または LLaMA 2 モデルに基づく既存のコンテキスト長外挿法について広範な調査を実施し、新しい切り捨て戦略を提案しました。


  • 論文アドレス: https://arxiv.org/abs/2308.10882
  • プロジェクトアドレス: https://github.com/abacusai/long-context

この切り捨て戦略の有効性を検証するために、この研究では 3 つの新しい 13B パラメータの長いコンテキスト モデルをリリースしました。Giraffe には、LLaMA-13B に基づいてトレーニングされた 2 つのモデル (コンテキスト長はそれぞれ 4k と 16k) と、LLaMA2-13B に基づいてトレーニングされた 1 つのモデル (コンテキスト長は 32k) が含まれています。このモデルは、LLaMA2 に基づく 32k コンテキスト ウィンドウを備えた最初のオープン ソース LLM でもあります。

Abacus.AIのCEOであるBindu Reddy氏がTwitterで紹介した。

32k コンテキスト ウィンドウの概念とは何ですか?これは約 24,000 語であり、オープンソース モデル Giraffe は 20,000 語の長い記事を処理できることを意味します。

画像出典: https://twitter.com/akshay_pachaar/status/1694326174158143619

方法の紹介

コンテキストの長さが増加すると、LLM アーキテクチャのアテンション メカニズムによってメモリ使用量と計算が 2 乗的に増加するため、長さの外挿法が重要になります。

この研究では、現在有効なコンテキスト長外挿法のいくつかをまとめ、線形スケーリング、xPos、ランダム位置エンコーディングなど、どの方法が最も効果的かを判断するために包括的なテストを実施しました。さらに、研究チームはいくつかの新しい方法も提案しており、そのうちの1つである「切り捨て」はテストに非常に効果的でした。

まず、LLM のパフォーマンスを評価する際の難しさの 1 つは、適切な評価方法を選択することです。一般的に使用される指標は、次のトークンの難しさです。これは、コンテキストに基づいて次のトークンを予測するモデルの能力を測定します。しかし、研究チームは、この指標で良好な結果を得るには通常、利用可能なコンテキスト全体のごく一部に基づいて、適度に一貫性のあるテキスト分布を生成することで達成できると考えているため、長いコンテキストには適していません。

長いコンテキストの状況でのモデルのパフォーマンスを分析するために、この研究では、モデルの再現精度を測定指標として使用し、モデルの長いコンテキストのパフォーマンスを評価するための 3 つのデータセット、LongChat-Lines、FreeFormQA、および AlteredNumericQA を公開しました。このうち、LongChat-Lines はキーと値の取得タスクに使用され、FreeFormQA と AlteredNumericQA は自然な質問データセットに基づく質問応答データセットです。これら 3 つのデータセットは、キー値検索タスクと質問応答タスクにおける LLM の機能を評価できます。モデルが焦点を当てるコンテキストの長さが長いほど、精度が高くなります。

実験と結果

研究チームは、上記の 3 つの新しいデータセットを使用して、いくつかのコンテキスト長外挿方法に関する評価実験を実施しました。 LongChat-Lines の実験結果を以下の表 1 に示します。

FreeFormQA および AlteredNumericQA データセットの評価結果を以下の表 2 および 3 に示します。

全体的に、線形スケーリングが最も効果的であり、切り捨てにはある程度の可能性があり、xPos メソッドは微調整に適応できません。

興味のある読者は、原著論文を読んで研究内容の詳細を知ることができます。

<<:  AIによる労働者排除の進捗が発表され、真っ先に影響を受けるのは女性、アジア人、ホワイトカラー労働者!誰も免れることはできない

>>: 

ブログ    
ブログ    
ブログ    

推薦する

将来の医療における人工知能の重要な役割

今日の製薬業界が直面している最大の課題の 1 つは、新薬の開発と市場投入にかかるコストの高さです。こ...

スタートアップがAIを活用している3つの分野

[[311593]] [51CTO.com クイック翻訳] 人工知能は最新の開発トレンドであり、その...

ディープラーニングにも欠陥があり、同質のAIスタートアップ間の競争は熾烈になるだろう

[[186262]]この人工知能の波は急速に到来し、画像認識、音声認識、自動運転など、多くの難題を次...

...

AI による自動ラベル付けの普及により、データラベル作成者の職は失われるのでしょうか?

データ注釈業界では、「知能と同じくらい人工知能も存在する」という有名な格言があります。ラベル付けが必...

人工知能はチェスをプレイする以外に何をすべきでしょうか?

[[183486]]医療、金融、交通、教育、公安、小売、商業サービスなどの業界は、電子データの度合...

中国科学院深圳先端技術研究所:新しい知識強化グラフニューラルネットワークが説明可能な推奨を実現

近年、ビッグデータとディープラーニングに基づく人工知能は、驚くべきコンピューティング能力と学習能力を...

機械学習と人工知能の未来について語る

[[258702]] [51CTO.com クイック翻訳] 機械学習 (ML) と人工知能 (AI)...

2025年にはL3自動運転が普及する。まだ手動で運転しているのですか?

最近、中国自動車工学協会副秘書長、国際自動車工学科学技術革新戦略研究所執行理事の侯福神氏は上海モータ...

人工知能の市場推進要因、制約、機会

今日、ますます多くの企業が、事業運営に人工知能技術を活用しています。このテクノロジーは非常に建設的で...

...

年間5億ドルの損失で、OpenAIは2024年に破産するのでしょうか?アルタマン、GPU不足を明らかに、優秀な人材が退社

ChatGPT は、開始から 9 か月ですでに 2 億ドル近くを費やしています。海外メディアAnal...

トップ 10 の AI フレームワークとリポジトリのレビュー、その長所と短所の分析

[51CTO.com クイック翻訳] 人工知能は決して新しいものではありませんが、科学の分野では古く...

...

「人工知能」の時代が来るのか?将来的には「産業の新たな高地」となると予想され、多くの国がすでに計画を立てている。

[[415258]] 2017年、サウジアラビアの首都リヤドで開催された未来投資イニシアチブ会議に...