人工知能はデータを「食べる」

人工知能はデータを「食べる」

機械学習 (ML) プロジェクトに取り組んだことがある人なら、機械学習ではアルゴリズムをトレーニングするために大量のデータが必要であることを知っています。データは多ければ多いほど良いと言う人もいるでしょう。通常、データの量と結果として得られる機械学習モデルの複雑さの間には正の相関関係があります。 AIが新たな分野に拡大し、使用されるAI機能がより複雑になるにつれて、データに対する欲求はますます強くなるばかりです。 AI の複雑さに加えて、他のいくつかの傾向が問題を悪化させており、「AI プロジェクトを成功させるのに適切なデータを持っているか」という疑問が生じます。リソースがない場合、AI ブームに備えるためにもっと努力すべきでしょうか?

図1: AI/データの連続体

組織が収集したビッグデータがすべて正しいデータである可能性は低いですが、AI の方向性を理解することで、今後数十年にわたって AI が発展するにつれて、組織はより適切なデータを選別して収集するための「足がかり」を得ることができます。

人工知能の発展はデータゲームを変えた

機械学習は自身の動作を修正するために大量のデータを必要としますが、人工知能機能の複雑さが増すにつれて、データの需要も急速に増加します。機械学習からディープラーニング (DL) への移行は大きな前進であり、ディープラーニングでは機械学習よりもはるかに多くのデータが必要になります。その理由は、ディープラーニングでは通常、ニューラル ネットワークのレイヤー間の概念的な違いしか認識できないためです。数百万のデータ ポイントにさらされると、ディープラーニングは概念の境界を決定できます。ディープラーニングにより、機械は人間の脳のようにニューラルネットワークを通じて概念を表現できるようになり、より複雑な問題を解決できるようになります。 AI は、答えがより不確実または曖昧になることが多い、より曖昧な問題も解決できます。これは通常、判断や認識の問題であり、創造やその他の右脳活動にまで及ぶ可能性があります。その結果、データに対する需要が高まり、場合によっては緊急性やリアルタイム性が求められることもあります。

データ主導から結果主導への変革

AI が複雑な問題を支援または解決する中で進化するにつれて、AI はデータ駆動型、目標/結果駆動型になります。つまり、AI は特定の問題を解決したり、特定の推論を行ったりするときに、その場でデータを要求する可能性があり、データ管理がより複雑になります。目標仮説を達成するためには、ソリューションの帰納的データ駆動型部分とデータの演繹的要件との相互作用が必要になる場合があります。結果指向の問題には、このタイプの動的な相互作用が必要です。これは、興味のあるイベントやパターンを探して単にデータを取得することとは大きく異なります。意思決定主導型のアプローチは、これら 2 つの異なるモデルのちょうど中間に位置します。データと結果を一致させることで、いくつかの決定がどのように機能しているかに焦点を当て、改善することが可能になります。帰納的にも演繹的にも、より戦略的な決定が生まれるでしょう。これは、データ使用の需要を促進する要因の 1 つにすぎません。

問題の範囲を変更するとデータ要件に影響する

AI ソリューションの範囲は通常、最初は狭い範囲から始まり、時間の経過とともに範囲が拡大し、より多くのデータが必要になります。複雑なソリューションでは、多くの場合、複数の回答を目指しており、分岐するソリューション セットをサポートするためにより多くのデータが必要になるため、結果が複雑で混合したものになります。意思決定、行動、結果の範囲が組織の内外のより多くのシナリオに及ぶにつれて、各シナリオとそれらの相互作用を理解するために、より多くのデータが必要になります。これらのシナリオはそれぞれ異なる速度で変化し、変化する可能性があるため、より多くのデータが必要になります。

要約する

明らかに、より多くのデータが AI 支援ソリューションの特徴となるでしょう。データへの渇望は、より困難な問題、高度な AI/分析のより有効な活用、またはエンドツーエンドのバリュー チェーンの成長から生じる可能性があります。確かなことはただ一つ。組織は「AI/データの相互作用」という新しい世界に備える必要があります。データ管理戦略、方法、テクノロジーを変更または拡張します。

<<:  機械学習: IoT 成功の秘訣?

>>:  ファーウェイ、2020年に向けて次世代マシンビジョンカメラと新製品を発表

ブログ    
ブログ    
ブログ    

推薦する

NLP事前トレーニングパラダイムが統合され、下流のタスクタイプに絡まらなくなり、Googleの新しいフレームワークは50のSOTAを更新します

この論文では、Google の研究者がさまざまな事前トレーニング パラダイムを統合する事前トレーニン...

ジャック・マーとイーロン・マスクは「愛し合い、憎み合っている」:人間とテクノロジーの競争の勝者は誰か?

8月29日、国家発展改革委員会、科学技術部、工業情報化部、中国サイバースペース管理局、中国科学院、...

自動運転の研究の方向性は間違っているのか?

1 知覚ソリューション: 純粋な視覚とマルチセンサー融合自動車が自動運転を実現するには、まず周囲を...

...

人工知能業界の給与が明らかに、転職の時期が来た

人工知能は、現在最もホットな産業であると言っても過言ではありません。最先端のテクノロジー企業から革新...

予想外! AI技術はアダルト動画サイトに成熟して適用されている

アダルト動画サイトがAI技術を導入!ウェブサイトでは、顔認識やアルゴリズムを使用したビデオプレビュー...

インダストリー4.0: AIを活用した障害検出

[[359728]] AI の向上とマシン ビジョン制御の向上を組み合わせることで、スマート製造業界...

ChatGPTに「カスタムコマンド」機能が追加されました

海外メディアの報道によると、7月21日、OpenAIはユーザーにChatGPTの応答に対する強化され...

GPT-4 パラメータは 10 兆に達します!この表は、新しい言語モデルのパラメータが GPT-3 の 57 倍になると予測しています。

機械学習の場合、パラメータはアルゴリズムの鍵となります。パラメータは、履歴入力データであり、モデルト...

AIシステムのグレーディングを通じて企業のコスト管理を支援

翻訳者 | 張毅校正 | 梁哲、孫淑娟自動車技術協会(SAE)が自動運転車を分類しているのと同じよう...

人工知能とモノのインターネット (AIoT) を組み合わせた場合の威力とは?

モノのインターネット (IoT) や人工知能 (AI) について聞いたことがあると思います。しかし、...

...

医療と人工知能の相互統合が眼科治療に新たな窓を開く

目は体表にある器官の中で画像データを取得しやすい器官であり、その健康状態は人々の生活や学習に与える影...

知能ロボット技術の応用と開発動向

王耀南院士が2020年国家ロボット開発フォーラムで報告著者プロフィール:王耀南、中国工程院院士、湖南...

...