少数ショット学習(1) — 機械学習におけるタスク最適化空間

少数ショット学習(1) — 機械学習におけるタスク最適化空間

[[401868]]

今日のディープラーニングの成功には大量のデータが必要であり、これは不可欠な前提条件です。私たちがトレーニングしたモデルはすべて経験を経ており、非常に優れたパフォーマンスを達成しています。しかし、現実には十分なデータを集めるのは簡単ではありません。今日はこの問題をもとにFew-shot Learningについて学びます。

上記の式はモデルを推定するために使用されます。通常、モデルによって学習される関数 h に式 x を入力します。この L は予測値と真の値の差を表し、この差をデータ サンプル全体に積分して関数 h の適合度を評価します。

上記の式は、R(h)を最小化する関数hを見つけるために使用できます。実際には、すべてのモデルとパラメータを走査することは不可能であるため、関数セットを制限して、空間全体でのモデルの探索範囲を狭める必要があります。ここでHは関数セットを定義すること、つまり全体の空間の中で特定の空間を分割し、モデル探索問題をこの空間に限定することを意味します。関数セットHはVGG、ResNetなどになります。関数セットが複雑であるほど、関数表現能力が強くなり、空間全体に占める範囲が広くなり、水色の円が大きくなり、探索時間も長くなります。実際のところ、サンプルの確率分布も不明であり、収集したサンプルはデータの一部にすぎません。

ここで、最適な関数の検索を H 空間に限定する必要があります。データp(x,y)の確率分布も不明であることはすでにわかっています。全体の分布を推定できるのは一定数のサンプルだけであり、当然ながらその際には誤差が生じます。

データ セット全体の確率分布は不明であるため、データ セット全体を表すために I サンプルが使用されます。このデータはモデルのトレーニングに使用されます。

そして、このようなデータセット上で、限られた空間内で最適な関数が検索され、緑色のブロックは、検索されたモデルの検索空間全体における位置を示すために使用されます。

次に、黄色のスタートから検索空間で検索を開始し、I サンプルのデータ セットで関数 h 添え字 l 全体を取得します。オレンジ色の点線は、実際のモデルと推定モデルの間のギャップを表します。

実際、ここでの誤差は近似誤差と推定誤差から生じます。

最初のステップは関数セットを選択することです。では関数セットとは何でしょうか? たとえば、VGG、ResNet、DenseNet は関数セット H と見なすことができます。アルゴリズム全体で制御できるのは I と H です。したがって、H の複雑さを増やす、つまり H 空間を拡張して I を増やすことはできますが、通常、収集できる実際の I は非常に小さくなります。

  • したがって、現在、過剰適合の問題を解決する最も直接的な方法は、数を増やすこと、つまり I (データ) を増やすことです。
  • つまり、Hにいくつかの制約を追加して検索空間(モデル)を狭める
  • もう一つは、適切な初期値(アルゴリズム)を与えることです。

<<:  チューリング賞受賞者ジョン・ヘネシー氏:データと機械学習は世界をより良い場所にする

>>:  プロセス自動化の分野をどのように理解すればよいでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

Oracle データベース初期化パラメータの分析: システム構成を最適化するための究極のガイド!

Oracle データベースでは、初期化パラメータは非常に重要な構成項目であり、データベースのパフォ...

世界動物の日: 動物保護と機械学習が出会うとき

動物を愛し、動物保護に尽力する世界中の人々にとって、今日は特別な日、「世界動物の日」です。毎年10月...

Omdia: 2024 年に注目すべき主要な AI トレンド

生成型 AI が人間と機械のコミュニケーション方法を変えるため、今年は人工知能にとって極めて重要な年...

マイクロマシンラーニングは、マイクロプロセッサにディープラーニングを組み込むことを約束する

翻訳者 | 朱 仙中校正 | 梁哲、孫淑娟ディープラーニング モデルの初期の成功は、大量のメモリと ...

TensorFlow レビュー: 最高のディープラーニング ライブラリ、そして今も進化中

[51CTO.com クイック翻訳] バージョン r1.5 のリリースにより、Google のオープ...

...

NvidiaはAIでの成功を量子コンピューティングに応用しようとしている

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

6つの権威あるリストを制覇したDAMOアカデミー独自の深層言語モデルシステムAliceMindはオープンソースです

[[406821]]自然言語処理 (NLP) は、AI の最高傑作として知られています。従来の NL...

自然:機械が人間の言語の出現を促進する

今週ネイチャー誌に掲載された科学報告で、研究者らはロボットが人間の言語の生成を促進できることを発見し...

F5、AI時代のアプリケーションセキュリティの新たな革命をリード

サンノゼ — 2024年2月20日— F5(NASDAQ: FFIV)は先日、アプリケーションセキュ...

クラウドAI市場は2028年までに2,700億ドルに達すると予想

デジタル時代の到来により前例のない進歩がもたらされ、人工知能(AI)はさまざまな業界でイノベーション...

人工知能は国家戦略となり、今こそこれらの人々にとって良い機会である

人工知能が私たちの生活に大きな利便性をもたらすことができるのは、その背後に多くの機能があるからです。...

...

CIO 向けガイド: ジェネレーティブ AI の「ハイライト モーメント」を実現する 5 つの方法

あらゆる誇大宣伝と主流の採用率の高さにもかかわらず、生成 AI は生産性のピークに到達する前に、幻滅...

TabR: 検索拡張により、深層学習は表形式データで勾配ブースティング モデルを上回るパフォーマンスを発揮できるようになりますか?

これは7月に発表された新しい論文で、深層学習が表形式データにおける勾配強化モデルを上回ることを可能に...