大規模言語モデルによる金融市場の予測

大規模言語モデルによる金融市場の予測
大規模言語モデル (LLM) は、数百万または数十億のパラメータを持つ人工ニューラル ネットワークで構成され、自己教師あり学習または半教師あり学習の手法を使用して大量のデータでトレーニングされ、情報を理解して応答します。金融業界では、株式市場の予測、金融教育、経済コンサルティング、取引戦略、感情分析、リスク管理など、さまざまな目的でこれらのツールを使い始めています。 ChatGPT によってもたらされた技術的進歩に加え、金融分野向けに特別に開発された BloombergGPT と FinGPT もあります。これら 3 つの LLM アプリケーションはすべて、金融セクターに影響を及ぼす可能性があります。

チャットGPT

フロリダ大学財務学部の教授2人は、金融業界で高度な法学修士号を取得すれば、株式市場の結果をより正確に予測できるようになり、取引戦略に役立つと考えています。この研究では、著者らは ChatGPT を使用して「ニュースの見出しの感情分析を使用して株式市場のリターンを予測」しました。彼らは、ChatGPT が BERT、GPT-1、GPT-2 などのモデルと比較して最高のパフォーマンスを発揮し、ChatGPT のようなより高度なモデルだけが大量のデータを分析して株式市場を正確に予測できることを発見しました。

ChatGPT は、人工知能の研究および展開企業である OpenAI が 2022 年 11 月に初めて導入した、生成型の事前トレーニング済みトランスフォーマー アーキテクチャに基づく LLM です。著者らによると、「GPT アーキテクチャは、多層ニューラル ネットワークを使用して自然言語の構造とパターンをモデル化します。教師なし学習アプローチを使用して、Wikipedia の記事や Web ページなどの大量のテキスト データで事前トレーニングされています。」この研究では、著者らは、証券価格研究センターと、2003 年に設立されたニュース分析データのプロバイダーである RavenPack から抽出したデータセットを使用しました。

著者らは、研究の最終結果は、感情分析に基づいて株式市場を予測する金融業界のツールとしての ChatGPT の可能性を単純に浮き彫りにしているだけだと述べている。彼らはまた、さらなる研究が必要であると指摘している。

ブルームバーグGPT

今年 3 月、ブルームバーグは金融業界向けに特別に開発された 500 億パラメータの LLM である BloombergGPT という独自の LLM をリリースしました。ブルームバーグが発表した研究論文によると、BloombergGPT はブルームバーグのデータソースから抽出された 3,630 億トークンのデータセットで構成されており、これには一般的なデータセットからの 3,450 億トークンも含まれています。

研究者らは、金融に特化した自然言語処理(NLP)ベンチマークでBloombergGPTを検証した。 LLM は、ブルームバーグ独自の内部ベンチマークセットに対しても検証されます。その結果、BloombergGPT は、GPT-NeoX、OPT66B、BLOOM176B、GPT-3 などの LLM と比較して最高のパフォーマンスを発揮することがわかりました。

「ML および NLP モデルの良し悪しは、入力するデータ次第です」とブルームバーグの機械学習 (ML) 製品および研究チームの責任者である Gideon Mann 氏は語ります。「ブルームバーグが 40 年以上にわたって収集した金融文書のおかげで、金融ユースケースに最適な LLM をトレーニングするための大規模でクリーンなドメイン固有のデータセットを細心の注意を払って作成することができました。BloombergGPT を使用して既存の NLP ワークフローを改善し、モデルを使用してクライアントにサービスを提供する新しい方法も考案できることを嬉しく思います。」

フィンGPT

独自の知識に基づく BloombergGPT とは異なり、FinGPT は金融業界向けに特別に開発されたオープンソース LLM です。 FinGPTは、DragonflyとSequoiaが支援する暗号通貨取引アプリFinbloxによって2023年3月にリリースされたAIファイナンシャルアドバイザーとして説明されています。この組織の目標は、金融分野における LLM を民主化することです。

「当社の使命は、ユーザーに知識とツールを提供し、金融の将来をコントロールできるようにすることです」と、フィンブロックスのCEO、ピーター・ホアンは述べています。「当社は、金融リテラシーと包摂性を誰もが利用できるようにすることに尽力しています。ユーザーフレンドリーなインターフェースとパーソナライズされた推奨事項を備えたFinGPTは、より包括的で魅力的な金融エコシステムの構築に向けた大きな一歩です。」

コロンビア大学とニューヨーク大学(上海)の研究チームは、FinGPT が金融業界向けの LLM の開発に必要なリソースを研究者とユーザーに提供できると考えています。 FinGPT のデータセットは、金融ニュース、ソーシャル メディア、ドキュメント、トレンド、学術機関から収集されています。 FinGPT はデータ中心のアプローチを採用し、フルスタック フレームワークを採用しています。

<<:  Databricks、ビッグデータ分析プラットフォームSpark向けAIモデルSDKをリリース:ワンクリックでSQLとFySpark言語チャートコードを生成

>>:  OpenAIはGPT-3.5 Turbo、DALL-E、Whisper APIを完全に公開しました

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

8つの一般的なアルゴリズムのアイデアを説明する1つの記事

アルゴリズムとデータ構造は、常にプログラマーの基本的なスキルでした。データ構造の基本インフラストラク...

Toutiaoに加えて、テキスト推奨の成功したアプリケーション事例は他に5つあります。

テキスト推奨は、推奨システムの応用シナリオとして、商業的に実装されて成功しています。最もよく知られて...

...

Android Things と TensorFlow を使用して IoT に機械学習を適用する方法

Android Things を Tensorflow と統合する方法と、機械学習を IoT システ...

ディープQ学習ネットワーク: 仮想ゲームから現実世界のアプリケーションへのギャップを埋める

翻訳者 |李睿レビュー | Chonglou人工知能と機械学習は、ヘルスケア、金融、エネルギー、輸送...

TikTokが米メディアにアルゴリズムの原則を導入:まずは8つの人気動画を使ってユーザーを理解する

人気の短編動画アプリ「TikTok」(Douyinの海外版)は、主にアルゴリズムのおかげで、世界中で...

5 つの主要分野をカバーする、知っておくべき 21 のオープンソース機械学習ツール

この記事では、まだ使ったことがないかもしれないオープンソースの機械学習ツールを21個紹介します。各オ...

人工知能がメンタルヘルスの改善に役立つ4つの方法

[51CTO.com クイック翻訳] 私たちはメンタルヘルスの危機を経験しています。世界人口の約 1...

工業生産は変化している:機械は人間よりも製造に優れている

最近、ロボットが人気になってきました。家庭生活、ホテル経営、学校教育、医療などさまざまな場面でロボッ...

緑の希望を守るため、人工知能が森林火災防止ネットワークを構築

ご存知のとおり、森林火災は世界の8大自然災害の一つであり、森林の安全に対する脅威です。平均すると、世...

2020年グローバルスマート教育会議でAI教育統合イノベーションの成果が発表されました

2020年8月20日から22日まで、北京で「人工知能と未来の教育」に重点を置いた、待望の「2020年...

人工知能は企業の調達戦略にどのように適合するのでしょうか?

どの大企業にとっても、調達は日々の業務において重要な役割を果たします。 [[317585]]企業は調...

Java プログラミング スキル - データ構造とアルゴリズム「スレッド バイナリ ツリー」

[[388829]]まず質問を見てみましょうシーケンス{1,3,6,8,10,14}を二分木に構築...

たった5秒でNeRFをトレーニング? ! Nvidia の新技術は Google の研究者の手に負えない | オープンソース

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...