人工知能はデータを「食べる」

人工知能はデータを「食べる」

機械学習 (ML) プロジェクトに取り組んだことがある人なら、機械学習ではアルゴリズムをトレーニングするために大量のデータが必要であることを知っています。データは多ければ多いほど良いと言う人もいるでしょう。通常、データの量と結果として得られる機械学習モデルの複雑さの間には正の相関関係があります。 AIが新たな分野に拡大し、使用されるAI機能がより複雑になるにつれて、データに対する欲求はますます強くなるばかりです。 AI の複雑さに加えて、他のいくつかの傾向が問題を悪化させており、「AI プロジェクトを成功させるのに適切なデータを持っているか」という疑問が生じます。リソースがない場合、AI ブームに備えるためにもっと努力すべきでしょうか?

図1: AI/データの連続体

組織が収集したビッグデータがすべて正しいデータである可能性は低いですが、AI の方向性を理解することで、今後数十年にわたって AI が発展するにつれて、組織はより適切なデータを選別して収集するための「足がかり」を得ることができます。

人工知能の発展はデータゲームを変えた

機械学習は自身の動作を修正するために大量のデータを必要としますが、人工知能機能の複雑さが増すにつれて、データの需要も急速に増加します。機械学習からディープラーニング (DL) への移行は大きな前進であり、ディープラーニングでは機械学習よりもはるかに多くのデータが必要になります。その理由は、ディープラーニングでは通常、ニューラル ネットワークのレイヤー間の概念的な違いしか認識できないためです。数百万のデータ ポイントにさらされると、ディープラーニングは概念の境界を決定できます。ディープラーニングにより、機械は人間の脳のようにニューラルネットワークを通じて概念を表現できるようになり、より複雑な問題を解決できるようになります。 AI は、答えがより不確実または曖昧になることが多い、より曖昧な問題も解決できます。これは通常、判断や認識の問題であり、創造やその他の右脳活動にまで及ぶ可能性があります。その結果、データに対する需要が高まり、場合によっては緊急性やリアルタイム性が求められることもあります。

データ主導から結果主導への変革

AI が複雑な問題を支援または解決する中で進化するにつれて、AI はデータ駆動型、目標/結果駆動型になります。つまり、AI は特定の問題を解決したり、特定の推論を行ったりするときに、その場でデータを要求する可能性があり、データ管理がより複雑になります。目標仮説を達成するためには、ソリューションの帰納的データ駆動型部分とデータの演繹的要件との相互作用が必要になる場合があります。結果指向の問題には、このタイプの動的な相互作用が必要です。これは、興味のあるイベントやパターンを探して単にデータを取得することとは大きく異なります。意思決定主導型のアプローチは、これら 2 つの異なるモデルのちょうど中間に位置します。データと結果を一致させることで、いくつかの決定がどのように機能しているかに焦点を当て、改善することが可能になります。帰納的にも演繹的にも、より戦略的な決定が生まれるでしょう。これは、データ使用の需要を促進する要因の 1 つにすぎません。

問題の範囲を変更するとデータ要件に影響する

AI ソリューションの範囲は通常、最初は狭い範囲から始まり、時間の経過とともに範囲が拡大し、より多くのデータが必要になります。複雑なソリューションでは、多くの場合、複数の回答を目指しており、分岐するソリューション セットをサポートするためにより多くのデータが必要になるため、結果が複雑で混合したものになります。意思決定、行動、結果の範囲が組織の内外のより多くのシナリオに及ぶにつれて、各シナリオとそれらの相互作用を理解するために、より多くのデータが必要になります。これらのシナリオはそれぞれ異なる速度で変化し、変化する可能性があるため、より多くのデータが必要になります。

要約する

明らかに、より多くのデータが AI 支援ソリューションの特徴となるでしょう。データへの渇望は、より困難な問題、高度な AI/分析のより有効な活用、またはエンドツーエンドのバリュー チェーンの成長から生じる可能性があります。確かなことはただ一つ。組織は「AI/データの相互作用」という新しい世界に備える必要があります。データ管理戦略、方法、テクノロジーを変更または拡張します。

<<:  機械学習: IoT 成功の秘訣?

>>:  ファーウェイ、2020年に向けて次世代マシンビジョンカメラと新製品を発表

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

スマート充電インフラ: 電気自動車の充電における人工知能の貢献

政府の電気自動車推進のビジョンに後押しされ、電気自動車業界はここ数年で大きな勢いを増しています。さら...

4K 品質の 3D 合成ビデオはもはやスライドショーにならず、新しい方法でレンダリング速度が 30 倍以上向上

4K 品質の 60 フレームのビデオは一部のアプリでメンバーシップがなければ視聴できませんが、AI ...

...

70%は輸入品。中国の産業用ロボットはチップのような悲劇をどう回避できるのか?

ロボットは産業の魂です。 [[386663]]しかし、私たちの身近な国である日本が、20年もの間、世...

製造業における機械学習と人工知能

より高品質の製品をより多く、より低コストで生産することは、製造業の永遠の目標です。スマート製造革命に...

人工知能センターオブエクセレンス:ビジネス変革を推進する新たなエンジン

AIセンターオブエクセレンスは、人材の統合、プラットフォームの標準化、ビジネス領域全体への成果の普及...

アンドリュー・ン氏の新たな動き:「データ中心のAI」の拠点となる新たなMLリソースサイトを設立

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

国内の音声対話モデルはこちら:Kai-Fu LeeとZero One Everythingが参加、中国語と英語のバイリンガルマルチモーダル、オープンソースで市販されている

中国語と英語のバイリンガル音声対話の最初のオープンソース モデルが登場しました。最近、arXivに音...

実践的 | この記事は、ディープラーニングをゼロから始めるのに役立ちます

この記事は、初心者の視点から始まり、真のゼロベースの視点から専門的なアドバイスとガイダンスを提供する...

国境を越えた大企業よ、安易に「自社開発チップ」を主張しないでほしい

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

2024年までにAIが広告に革命を起こす

人工知能 (AI) は、コンテンツの作成や顧客のセグメンテーションからキャンペーンの最適化まで、マー...

百新銀行と百度クラウドAI+銀行金融技術シンクタンク会議が開催、オープンバンキングについて議論

11月19日、北京で「百度銀行&百度クラウドAI+銀行金融技術シンクタンク」が開催されました。カンフ...

データセキュリティ認識システムにおける機械学習の応用

私たちは情報過多の世界に住んでおり、情報を追跡したり、他の人のために手動でキュレートしたりすることが...

ドローンの将来の用途

ドローンは、1960年代以降、政府と軍隊によるインテリジェントな戦闘装備の需要から生まれました。米軍...