大規模言語モデルによる金融市場の予測

大規模言語モデルによる金融市場の予測
大規模言語モデル (LLM) は、数百万または数十億のパラメータを持つ人工ニューラル ネットワークで構成され、自己教師あり学習または半教師あり学習の手法を使用して大量のデータでトレーニングされ、情報を理解して応答します。金融業界では、株式市場の予測、金融教育、経済コンサルティング、取引戦略、感情分析、リスク管理など、さまざまな目的でこれらのツールを使い始めています。 ChatGPT によってもたらされた技術的進歩に加え、金融分野向けに特別に開発された BloombergGPT と FinGPT もあります。これら 3 つの LLM アプリケーションはすべて、金融セクターに影響を及ぼす可能性があります。

チャットGPT

フロリダ大学財務学部の教授2人は、金融業界で高度な法学修士号を取得すれば、株式市場の結果をより正確に予測できるようになり、取引戦略に役立つと考えています。この研究では、著者らは ChatGPT を使用して「ニュースの見出しの感情分析を使用して株式市場のリターンを予測」しました。彼らは、ChatGPT が BERT、GPT-1、GPT-2 などのモデルと比較して最高のパフォーマンスを発揮し、ChatGPT のようなより高度なモデルだけが大量のデータを分析して株式市場を正確に予測できることを発見しました。

ChatGPT は、人工知能の研究および展開企業である OpenAI が 2022 年 11 月に初めて導入した、生成型の事前トレーニング済みトランスフォーマー アーキテクチャに基づく LLM です。著者らによると、「GPT アーキテクチャは、多層ニューラル ネットワークを使用して自然言語の構造とパターンをモデル化します。教師なし学習アプローチを使用して、Wikipedia の記事や Web ページなどの大量のテキスト データで事前トレーニングされています。」この研究では、著者らは、証券価格研究センターと、2003 年に設立されたニュース分析データのプロバイダーである RavenPack から抽出したデータセットを使用しました。

著者らは、研究の最終結果は、感情分析に基づいて株式市場を予測する金融業界のツールとしての ChatGPT の可能性を単純に浮き彫りにしているだけだと述べている。彼らはまた、さらなる研究が必要であると指摘している。

ブルームバーグGPT

今年 3 月、ブルームバーグは金融業界向けに特別に開発された 500 億パラメータの LLM である BloombergGPT という独自の LLM をリリースしました。ブルームバーグが発表した研究論文によると、BloombergGPT はブルームバーグのデータソースから抽出された 3,630 億トークンのデータセットで構成されており、これには一般的なデータセットからの 3,450 億トークンも含まれています。

研究者らは、金融に特化した自然言語処理(NLP)ベンチマークでBloombergGPTを検証した。 LLM は、ブルームバーグ独自の内部ベンチマークセットに対しても検証されます。その結果、BloombergGPT は、GPT-NeoX、OPT66B、BLOOM176B、GPT-3 などの LLM と比較して最高のパフォーマンスを発揮することがわかりました。

「ML および NLP モデルの良し悪しは、入力するデータ次第です」とブルームバーグの機械学習 (ML) 製品および研究チームの責任者である Gideon Mann 氏は語ります。「ブルームバーグが 40 年以上にわたって収集した金融文書のおかげで、金融ユースケースに最適な LLM をトレーニングするための大規模でクリーンなドメイン固有のデータセットを細心の注意を払って作成することができました。BloombergGPT を使用して既存の NLP ワークフローを改善し、モデルを使用してクライアントにサービスを提供する新しい方法も考案できることを嬉しく思います。」

フィンGPT

独自の知識に基づく BloombergGPT とは異なり、FinGPT は金融業界向けに特別に開発されたオープンソース LLM です。 FinGPTは、DragonflyとSequoiaが支援する暗号通貨取引アプリFinbloxによって2023年3月にリリースされたAIファイナンシャルアドバイザーとして説明されています。この組織の目標は、金融分野における LLM を民主化することです。

「当社の使命は、ユーザーに知識とツールを提供し、金融の将来をコントロールできるようにすることです」と、フィンブロックスのCEO、ピーター・ホアンは述べています。「当社は、金融リテラシーと包摂性を誰もが利用できるようにすることに尽力しています。ユーザーフレンドリーなインターフェースとパーソナライズされた推奨事項を備えたFinGPTは、より包括的で魅力的な金融エコシステムの構築に向けた大きな一歩です。」

コロンビア大学とニューヨーク大学(上海)の研究チームは、FinGPT が金融業界向けの LLM の開発に必要なリソースを研究者とユーザーに提供できると考えています。 FinGPT のデータセットは、金融ニュース、ソーシャル メディア、ドキュメント、トレンド、学術機関から収集されています。 FinGPT はデータ中心のアプローチを採用し、フルスタック フレームワークを採用しています。

<<:  Databricks、ビッグデータ分析プラットフォームSpark向けAIモデルSDKをリリース:ワンクリックでSQLとFySpark言語チャートコードを生成

>>:  OpenAIはGPT-3.5 Turbo、DALL-E、Whisper APIを完全に公開しました

ブログ    
ブログ    
ブログ    

推薦する

都市 AI アプリケーションの失敗事例: 善意の自治体 AI プロジェクトはなぜ失敗したのか?

編集者注: AI をどのように実装できるかを検討してきた私たちにとって、この Flint の事例は目...

普通の文書も会話に変えられる:会話補完技術の深い理解

会話型ロボットと聞くと、私と同じように、SiriやAlexaとの会話をすぐに思い浮かべますか?時には...

FBIが警告:AIを使ってサイバー攻撃を仕掛けるハッカーの数が驚くべき速度で増加している

PCMagによると、7月31日のニュースでは、金曜日の記者との電話会議で、FBIは人工知能プログラム...

...

小売環境におけるAIとIoTの長期的な応用

IoT カメラは、小売環境をより効率的かつ顧客に優しく、そして何よりもセキュリティと安全性を高めるこ...

...

機械学習を学ぶ必要がない5つの理由

機械学習を学び始めるべきだと言うインフルエンサーが増えています。彼らの言うことを聞くべきでしょうか?...

あらゆる角度から監視されることへの不安:AI はプライバシー侵害にどう対抗できるか?

インテリジェント時代では、アルゴリズムと計算能力の継続的な進歩により、AI 技術が急速に発展しました...

OpenAI CEOがGPT-5の開発中であることを明らかに

11月14日、海外メディアの報道によると、OpenAIはGPT-5の構築を開始した。同社のCEOサム...

クラウド AI とエッジ AI: 2022 年にはどちらがより良い選択でしょうか?

エッジ AI とクラウド AI は、現在企業が使用している最も重要なテクノロジーの一部であることがわ...

梅の花の山の上を歩くロボット犬?自転車は自分でバランスをとることができますか?テンセント・ロボティクスXラボ研究初の「開封」

テンセントは11月20日、移動ロボット研究における新たな進展を発表し、四足移動ロボット「ジャモカ」と...

...

大手企業がどのように人工知能を活用し、実践しているのかご覧ください。

人工知能に関しては、人々は複雑な感情を抱くことが多い。映画ファンなら、ウィル・スミスが『アイ、ロボッ...

人気のディープラーニングライブラリ23選のランキング

[[209139]] Data Incubator は最近、Github と Stack Overf...