機械学習アプリケーションが増加するにつれて、多くの人が機械学習トレーニング データを使用する利点を理解する必要があります。
機械学習をベースにしたシステムを使用する場合は、トレーニング データに関する知識が必要です。データをモデルトレーニング用に AI モデルにロードする前に、データが正しくフォーマットされ、その正確性が確保されている必要があります。 パブリック クラウドで一般的な機械学習システムを使用して不正検出エンジンを作成しているとします。まず、モデルをトレーニングするためのデータセットを作成する必要があります。この場合は、不正とマークされた何百万もの取引記録です。このようにして、モデルはどれが不正である可能性があり、どれがそうでないかを学習できます。もちろん、トレーニング データにはさまざまな種類があり、ラベル付きのものもあれば、ラベルなしのものもあります。 一度トレーニングすると、モデルは経験を通して学習するのではなく、起こりうる不正行為について学習することでトレーニングを継続できます。ユーザーに時間があれば、人間や他のシステムによって不正とフラグが付けられた取引を監視することで、モデルが自らトレーニングすることができます。 この AI トレーニング方法の印象的な点は、ユーザーが完全なトレーニング データセットを必要とすることです。場合によっては、トレーニング データはパブリック プロキシまたは独自のプロキシから取得できます。ほとんどの場合、ユーザーは機械学習モデルのトレーニング用に独自のデータをフォーマットできます。しかし、いつでもどこでもトレーニングできる機械学習モデルはあるのでしょうか? この考えは新しいものではありません。 AIが登場して以来、人々はAIエンジンが別のAIエンジンを教える、つまりトレーニングデータを共有することを望んできました。あるいは、自動化された直接的なやり取りを通じて知識と経験を共有するのがさらに良いでしょう。あるいは、AI エンジン メンターを通じて外部の経験を提供し、AI モデルの価値と効果を高めます。 これは言うのは簡単ですが、実行するのは難しいです。機械学習エンジンは、同じソフトウェアを使用している場合でも、通常は相互に通信しません。独立した学習者向けに、また AI 以外のシステムや人間と対話できるように、ゼロから設計する必要があります。ただし、ほとんどのベンダーは AI エンジン間のトレーニングを行っています。 近い将来、ゲームチェンジャーとなる可能性のあるいくつかの大きなトレンドが見られるでしょう。
私がこのことを取り上げる理由は、機械学習やディープラーニングを含む AI からより多くの価値を得たいのであれば、ほとんどの企業がこれらのトレンドを理解する必要があるからです。さらに、多くの企業は、機械学習を適切に機能させるのに十分なトレーニングデータがないことに苦労しています。これは両方の問題に対する良い解決策となるかもしれません。 |
<<: RPA大手UiPath独占インタビュー:やがて「1人1台ロボット」の時代が到来
>>: 景気後退は大きな不確実性をもたらします。AIに投資する際に理解すべき重要なポイントは何でしょうか?
最近では、GPT や LLaMA などの大規模言語モデル (LLM) が世界中で人気になっています。...
2020年は異例の年です。新型コロナウイルスの世界的な蔓延は人々の生活や仕事に多くの不便をもたらし、...
かつては世界で最も強力だと考えられていたGPT-4も、リリース以来、いくつかの「信頼の危機」を経験し...
人工知能は複雑な囲碁のゲームでは簡単に人間に勝つことができますが、科学的な発見に役立つのでしょうか?...
[[262014]]自動運転は近年注目されている研究開発プロジェクトです。市場に投入される前にシミュ...
ソラの登場はAI界全体に熱狂を巻き起こしたが、ルカンは例外だった。 OpenAI による Sora ...
AI時代に注目すべき新たな変化は、テクノロジー大手がAIチップを独自に開発し始めたことだ。これは一...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
1. インテリジェントビル通信システムの構成インテリジェントビル通信システムは、主に以下の部分で構成...