大規模言語モデルによる金融市場の予測

大規模言語モデルによる金融市場の予測
大規模言語モデル (LLM) は、数百万または数十億のパラメータを持つ人工ニューラル ネットワークで構成され、自己教師あり学習または半教師あり学習の手法を使用して大量のデータでトレーニングされ、情報を理解して応答します。金融業界では、株式市場の予測、金融教育、経済コンサルティング、取引戦略、感情分析、リスク管理など、さまざまな目的でこれらのツールを使い始めています。 ChatGPT によってもたらされた技術的進歩に加え、金融分野向けに特別に開発された BloombergGPT と FinGPT もあります。これら 3 つの LLM アプリケーションはすべて、金融セクターに影響を及ぼす可能性があります。

チャットGPT

フロリダ大学財務学部の教授2人は、金融業界で高度な法学修士号を取得すれば、株式市場の結果をより正確に予測できるようになり、取引戦略に役立つと考えています。この研究では、著者らは ChatGPT を使用して「ニュースの見出しの感情分析を使用して株式市場のリターンを予測」しました。彼らは、ChatGPT が BERT、GPT-1、GPT-2 などのモデルと比較して最高のパフォーマンスを発揮し、ChatGPT のようなより高度なモデルだけが大量のデータを分析して株式市場を正確に予測できることを発見しました。

ChatGPT は、人工知能の研究および展開企業である OpenAI が 2022 年 11 月に初めて導入した、生成型の事前トレーニング済みトランスフォーマー アーキテクチャに基づく LLM です。著者らによると、「GPT アーキテクチャは、多層ニューラル ネットワークを使用して自然言語の構造とパターンをモデル化します。教師なし学習アプローチを使用して、Wikipedia の記事や Web ページなどの大量のテキスト データで事前トレーニングされています。」この研究では、著者らは、証券価格研究センターと、2003 年に設立されたニュース分析データのプロバイダーである RavenPack から抽出したデータセットを使用しました。

著者らは、研究の最終結果は、感情分析に基づいて株式市場を予測する金融業界のツールとしての ChatGPT の可能性を単純に浮き彫りにしているだけだと述べている。彼らはまた、さらなる研究が必要であると指摘している。

ブルームバーグGPT

今年 3 月、ブルームバーグは金融業界向けに特別に開発された 500 億パラメータの LLM である BloombergGPT という独自の LLM をリリースしました。ブルームバーグが発表した研究論文によると、BloombergGPT はブルームバーグのデータソースから抽出された 3,630 億トークンのデータセットで構成されており、これには一般的なデータセットからの 3,450 億トークンも含まれています。

研究者らは、金融に特化した自然言語処理(NLP)ベンチマークでBloombergGPTを検証した。 LLM は、ブルームバーグ独自の内部ベンチマークセットに対しても検証されます。その結果、BloombergGPT は、GPT-NeoX、OPT66B、BLOOM176B、GPT-3 などの LLM と比較して最高のパフォーマンスを発揮することがわかりました。

「ML および NLP モデルの良し悪しは、入力するデータ次第です」とブルームバーグの機械学習 (ML) 製品および研究チームの責任者である Gideon Mann 氏は語ります。「ブルームバーグが 40 年以上にわたって収集した金融文書のおかげで、金融ユースケースに最適な LLM をトレーニングするための大規模でクリーンなドメイン固有のデータセットを細心の注意を払って作成することができました。BloombergGPT を使用して既存の NLP ワークフローを改善し、モデルを使用してクライアントにサービスを提供する新しい方法も考案できることを嬉しく思います。」

フィンGPT

独自の知識に基づく BloombergGPT とは異なり、FinGPT は金融業界向けに特別に開発されたオープンソース LLM です。 FinGPTは、DragonflyとSequoiaが支援する暗号通貨取引アプリFinbloxによって2023年3月にリリースされたAIファイナンシャルアドバイザーとして説明されています。この組織の目標は、金融分野における LLM を民主化することです。

「当社の使命は、ユーザーに知識とツールを提供し、金融の将来をコントロールできるようにすることです」と、フィンブロックスのCEO、ピーター・ホアンは述べています。「当社は、金融リテラシーと包摂性を誰もが利用できるようにすることに尽力しています。ユーザーフレンドリーなインターフェースとパーソナライズされた推奨事項を備えたFinGPTは、より包括的で魅力的な金融エコシステムの構築に向けた大きな一歩です。」

コロンビア大学とニューヨーク大学(上海)の研究チームは、FinGPT が金融業界向けの LLM の開発に必要なリソースを研究者とユーザーに提供できると考えています。 FinGPT のデータセットは、金融ニュース、ソーシャル メディア、ドキュメント、トレンド、学術機関から収集されています。 FinGPT はデータ中心のアプローチを採用し、フルスタック フレームワークを採用しています。

<<:  Databricks、ビッグデータ分析プラットフォームSpark向けAIモデルSDKをリリース:ワンクリックでSQLとFySpark言語チャートコードを生成

>>:  OpenAIはGPT-3.5 Turbo、DALL-E、Whisper APIを完全に公開しました

ブログ    
ブログ    
ブログ    

推薦する

TensorFlow を使用したコンテキスト チャットボットの実装

日常のチャットでは、文脈が重要です。 TensorFlow を使用してチャットボット フレームワーク...

...

テンセントが自動運転車市場に参入、百度セキュリティが共同で「OASESスマート端末セキュリティエコロジカルアライアンス」を設立

テンセントは自動運転システムを開発し、無人運転市場への参入も狙っている。百度セキュリティはファーウェ...

生産効率が50%アップ!ファーウェイはAI機能を活用して大東コイルのデジタル変革を推進し、コスト削減と効率向上に貢献している。

デジタル変革は、現在の企業、特にハイテクの伝統的な製造業の主なテーマとなっています。人工知能、クラウ...

...

...

...

PULSE: 暗黙の空間に基づく画像超解像アルゴリズム

CVPR 2020 に採択された論文「PULSE: 生成モデルの潜在空間探索による自己教師あり写真ア...

OpenAI、中小企業向けChatGPTチームサブスクリプションサービスを開始、月額料金は1人あたり30ドル

1 月 11 日、OpenAI は小規模なセルフサービス チーム専用の新しいサブスクリプション プラ...

OpenAI、テキストから動画を生成できる新しい大規模モデル「Sora」を発表

海外メディアの報道によると、OpenAIは2月18日、短いテキストプロンプトを通じて「リアル」かつ「...

あらゆる人間の声を再現できるAI技術

ポッドキャスト業界は、よりリラックスした、自然でカジュアルなオーディオストーリーテリングへと移行して...

TensorFlow を使用した ML モデルの実装と最適化: 1 秒あたり 3 億回の予測

[[425184]] TensorFlow は最も広く使用されている機械学習フレームワークの 1 つ...

ネットユーザーの83%を騙した!画像生成の頂点、DALL-E 2 は実際にチューリングテストに合格したのか?

数日前、休暇中だったネットユーザーが「DALL-E 2」にアクセスできたことを知った。 2秒間考えた...

...