2020年2月7日、第34回アメリカ人工知能学会年次会議(AAAI 2020)にディープラーニングの三大巨頭が集結し、「コンピュータービジョン」と「機械学習」が両サイドに並び、最優秀論文を競い合いました。最後に、清華大学と南洋理工大学の「分割可能品と分割不可能品が混在する商品の公平な分割」と題する論文が最優秀学生論文賞を受賞しました。 論文アドレス: https://arxiv.org/pdf/1911.07048.pdf このとき、人々は突然目を覚ましました。ディープラーニングはゲーム理論や経済学の分野で長い間活用されてきたことが判明しました。論文の採択率から判断すると、3本に1本の論文の採択率がすでにトップになっています。これはベテラン経済学者の目には信じられないことのように思えます。結局のところ、経済研究の焦点は予測ではなく、経済現象の説明と経済活動を支配する法則の解明にあります。より具体的に言えば、ディープラーニングのブラックボックス的な性質は、最適化されたパラメータを効果的に説明できず、パラメータが経済法則にどのように影響するかという具体的なメカニズムも説明できません。 しかし、AI経済学者によるディープラーニングの活用には独特の魅力もあります。 税設計のための強化学習2 段階の学習フレームワーク スタンフォード大学の准教授である Richard Socher 氏は、元の経済環境を使用して税制を設計する、インテリジェント エージェント (労働者) と税制 (政府) を含む 2 段階の強化学習フレームワークを開発しました。 動的にシミュレートされた世界では、木材と石材の 2 つのリソースのみが設定されており、リソースの再生速度は限られていると想定されます。労働者は世界中をランダムに歩き回って資源を集め、家を買ったり売ったり建てたりしてお金を稼ぎます。お金は効用(満足度)をもたらしますが、家を建てる労力は効用を減少させます。 また、異なる技能を持つ労働者は労働効率が異なるという前提のもと、労働者が稼いだお金は課税対象となり、所得税は労働者全員に平等に分配される制度となっています。 平等な分配の仕組みには労働者の戦略的ビジョンが必要です。シミュレートされた世界の労働者が効用を最大化することを目指すと、低スキルの労働者が自分で収集して販売し、高スキルの労働者が材料を購入して構築するというシステム全体が出現します。 経済学ではこれを「専門化」と呼び、システムの効用を最大化します。 モデル全体の動作中、強化学習の最適な税金設計が報酬モデルとして使用されます。政策立案者は、税率を設定して労働者の税引き後所得水準に影響を与えることができます。労働者は、資源の売買や住宅の建設によってお金(効用)を稼ぎます。強化学習の報酬目標は、システム全体の効用を最大化することです。 この報酬目標により、労働者と政策立案者の行動は、システム全体に対して内部的および外部的な課題を生み出します。 内側のループでは、労働者は働きながら、お金を稼ぎながら、税金を支払いながら、常に行動を調整します。このとき、固定の税率が与えられると、問題は固定報酬関数を持つ標準的なマルチエージェント強化学習問題になります。 外部サイクルでは、社会目標を最適化するために税制が調整されます。これにより、強化学習エージェントが変化するユーティリティ環境に常に適応する必要がある非静的な学習環境が作成されます。 最後に、著者らは、税率表(米国の所得税の課税方法に類似)の学習やエントロピー正則化などの手法を使用することで、安定した収束点を見つけることができることを発見しました。実験結果によると、強化学習を使用する AI エコノミストは、生産性をわずか 11% 低下させるだけで平等性を 47% 向上させることができることがわかりました。 仮想世界で実際の経済状況をシミュレートし、より優れたシステムを設計することは、AI と経済を組み合わせる 1 つの方法にすぎません。実際、深層強化学習は、リスクパラメータと不確実性が増大する実際の経済問題に直面した場合でも、より優れたパフォーマンスと高い精度を提供できます。 経済におけるディープラーニングの応用論文をダウンロード: https://arxiv.org/ftp/arxiv/papers/2004/2004.01509.pdf 論文「経済学における深層強化学習の方法と応用の包括的レビュー」では、ドレスデン工科大学とオックスフォード・ブルックス大学の研究者が経済学における強化学習の活用について詳しく説明しています。 株価、オークションの仕組み、マクロ経済学など 12 の分野を調査した結果、ディープラーニング アルゴリズムは、精度と堅牢性の点で従来の経済および統計アルゴリズムよりも優れていることがわかりました。 1. ディープラーニングによる株価評価 株価は非常に不確実でリスクが高い。株価予測を克服するモデルを開発できれば、モデル作成者に莫大な利益をもたらすことは間違いない。ディープラーニングを使用して株価を予測する最新の進捗状況を次の表に示します。 株価の変動にとって感情は間違いなく非常に重要です。現在の研究のほとんどは非効率的な感情データセットに依存しており、モデルのパフォーマンスが低下することがよくあります。[68]で提案された2ストリームゲート型リカレントユニットは、LSTMモデルよりも優れたパフォーマンスを発揮することがわかりました。さらに、彼らはStock2Vec埋め込みモデルを提案し、ハーバードIV-4を使用しながら市場リスクの観点からモデルの堅牢性を証明しました。
2. ディープラーニング下の保険業界 現在、保険業界が直面している問題は、不正検出をいかに効果的に管理するかということです。したがって、機械学習技術は、この問題に対処するためにあらゆる種類のリスクを測定するアルゴリズムを徐々に開発してきました。
3. ディープラーニングによるオークションの仕組み オークションの仕組みの核心は、入札者が利益を最大化するために最適な戦略を計画する必要があることです。最新の研究結果は次の表に示されています。
4. ディープラーニングによる銀行業務とオンライン市場 オンラインショッピングやクレジットカードのシナリオでは、不正検出の要件が非常に高くなっています。強化学習の最先端の研究結果を次の表に示します。
5. ディープラーニングによるマクロ経済学 マクロ経済学において最も重要な課題は、失業率やGDP成長率などの指標予測です。ニューラルネットワーク方式を用いた最新の研究結果が下の図に示されています。
6. 金融市場におけるディープラーニング 金融市場では、信用リスクに効果的に対処することが極めて重要です。最近のビッグデータ技術の進歩により、ディープラーニング モデルは銀行システムの信用リスクを予測するための信頼性の高い金融モデルを設計できるようになりました。最新の研究は次の表に示されています。
7. ディープラーニングへの投資 財務上の問題では、多くの場合、複数のソースからのデータ セットの分析が必要になります。したがって、データ内の外れ値や特徴を処理するための堅牢なモデルを構築することが非常に重要です。最新の研究結果は以下の通りです。
8. ディープラーニングと小売業 小売業で最も広く使用されているテクノロジーは拡張現実 (AR) であり、顧客のショッピング体験を向上させることができます。最新の研究結果は次のとおりです。
9. ディープラーニングに基づくビジネスインテリジェンス
高次元経済問題への強化学習の応用前回は、経済分野におけるディープラーニングの応用について紹介しました。従来のディープラーニングと比較して、深層強化学習は高次元の問題を効果的に処理できます。したがって、高次元の動的データを含む一部の経済問題では、深層強化学習の方が優れたパフォーマンスを発揮します。 1. 深層強化学習による株式取引 従来の強化学習法は、高次元の問題を処理する能力が不足しているため、最適な戦略を見つけるのに十分ではありません。以下は深層強化学習の最新の研究です。
2. 深層強化学習によるポートフォリオ管理
Yuら[120]は、自動取引の文脈において、グローバルな目標に関連した行動を起こし、連続的な意思決定を行うことができる新しいモデルベースの深層強化学習スキームを設計した。モデル アーキテクチャは、インジェクション予測モジュール (IPM)、生成的敵対的データ拡張モジュール (DAM)、および動作クローニング モジュール (BCM) で構成されており、設計のバックテストの処理に使用できます。 3. 深層強化学習に基づくオンラインサービス オンライン サービスは主に推奨アルゴリズムに重点を置いています。現在、コンテンツ ベースの協調フィルタリング、因数分解マシン、多腕バンディット マシンなど、推奨方法が多数あります。ただし、これらの方法のほとんどは、ユーザーと推奨システム間の静的なやり取りに限定されており、短期的な報酬に焦点を当てています。 深層強化学習手法を使用した現在の進捗状況は次のとおりです。
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。 |
<<: テクノロジー大手が自動運転市場への参入を急いでいる背景に、あなたが知らないことは何でしょうか?
>>: あなたはキング・オブ・グローリーをプレイしていますが、誰かがiPhoneを使ってニューラルネットワークをトレーニングしています
[[437808]]人間とコンピュータのゲームは長い歴史があり、人工知能の主要技術を検証するための主...
[51CTO.comからのオリジナル記事] 高速かつ高性能なコンピュータの登場により、顔画像技術は大...
COVID-19の流行は深刻ですが、多くの新しい技術の助けにより、予防と制御の対策は何年も前と同じ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
有名なフランス人プログラマー、ファブリス・ベラール氏は最近、普通のデスクトップコンピュータ(2,00...
有名なイギリスの科学者スティーブン・ホーキングはかつて、知能機械を作ろうとする人間の努力は私たち自身...
著者: キリアンマシンハートが編集参加者: ヌルハチュ・ヌル、リー・ヤージョウこの記事では、研究者の...
2024年には、AI技術を取り巻くより困難な問題のいくつかを解決するための進歩が見られることを期待...
中国インターネット情報センター(CNNIC)が発表した第41回中国インターネット発展統計報告によると...
州や自治体が新型コロナウイルスから国民を守るために制限措置を講じてきたため、ほぼ2年間、あらゆる種類...