ガートナーの予測: データレイクの90%は役に立たなくなる

ガートナーの予測: データレイクの90%は役に立たなくなる

ガートナーは以前、2018 年までにデータ レイクの 90% が生データで満たされ、そのテクノロジを使用する人がほとんどいないため役に立たなくなると予測していました。

現在のテクノロジーの世界では、人工知能 (AI) ほど好奇心と興奮を掻き立てるものはありません。 AI の潜在的な利点は、企業内でようやく現れ始めています。

しかし、データ サイエンティストが効果的な AI モデルを構築するために必要な関連データにアクセスできないことが多いため、企業における AI の成長は妨げられています。これらのデータ エキスパートは、必要なすべてのリアルタイム データを活用するのではなく、既存のデータ ウェアハウスなどのいくつかの既知のソースのみに頼らざるを得ないことがよくあります。さらに、多くの企業は、大量のデータのビジネスコンテキストと品質を効果的かつコスト効率よく判断することに苦労しています。こうした困難を考慮すると、AI の加速と導入を阻む歴史的な障壁のいくつかは容易に理解できます。

データが AI にとって価値がある場合にのみ、ユーザーは自信を持って安全にデータを使用して AI モデルをトレーニングできます。これを実現する唯一の方法は、「スマートデータ」に基づくことです。

長年にわたり、私たちはデータの収集と集約を超えて、特定のビジネス アプリケーションを推進してきました (データ 1.0)。組織は、誰もがデータにアクセスできる明確に定義されたプロセスを作成できるようになりましたが、それだけでは十分ではありません。現在では、企業全体の変革を真に推進するためにインテリジェントなデータが必要な段階に達しています (データ 3.0)。

たとえば、企業が顧客ベースとの従来の関係を再定義しようとするときに直面する課題を考えてみましょう。この破壊的な変化を乗り越えるには、データベース、データ ウェアハウス、アプリケーション、ビッグ データ システム、IoT、ソーシャル メディアなどの多数のデータ ソース、構造化、半構造化、非構造化などのさまざまなデータ タイプ、オンプレミス、クラウド、ハイブリッド、ビッグ データ要素などのさまざまな場所からの入力が必要です。

今日、データ レイクは、情報変革の時代に必要とされる大量の多様なデータを保存する究極のリポジトリになりつつあります。しかし、スマートデータがなければ、これらの湖はほとんど価値がありません。ガートナーは以前、2018 年までにデータ レイクの 90% が生データで満たされ、そのテクノロジを使用する人がほとんどいないため役に立たなくなると予測していました。

対照的に、スマート データを使用すると、データ サイエンティストは Google のような検索を実行し、関連するデータの潜在的なソースをすべて即座に発見できます。スマート データを使用すると、データ サイエンティストがモデルに必要なデータの収集、組み立て、調整に費やす貴重な時間を大幅に節約できます。

では、データが本当にインテリジェントであることをどうやって保証するのでしょうか? 広範なメタデータによって駆動される機械学習と AI 機能を使用するエンドツーエンドのデータ管理プラットフォームを構築し、プラットフォーム全体の生産性を向上させます。メタデータはデータの価値を引き出す鍵です。

AI 技術を実装するための包括的で関連性のある正確なデータを提供したい場合は、次の 4 つの異なるメタデータ カテゴリを確認する必要があります。

  1. 技術メタデータ - データベース テーブルと列の情報、およびデータの品質に関する統計が含まれます。
  2. ビジネス メタデータ - データのビジネス コンテキストと、それが関与するビジネス プロセスを定義します。
  3. 運用メタデータ - ソフトウェア システムとプロセス実行に関する情報。
  4. 使用状況メタデータ - アクセスしたデータセット、評価、コメントなど、ユーザーアクティビティに関する情報。

このメタデータのコレクションに AI と機械学習を適用すると、適切なデータを識別して推奨できるだけでなく、このデータは人間の介入なしに自動的に処理できるため、エンタープライズ AI プロジェクトに適しています。

デジタル変革により、組織はデータに対する見方を変える必要に迫られています。これは「獲物になるか、捕食者になるか」という問題です。現在、データとツールへのリアルタイム アクセスにより迅速な分析が可能になり、人工知能と機械学習が促進され、データ ファースト アプローチへの移行が可能になります。人工知能によってもたらされた情報技術革命は、デジタル化、データの爆発的増加、そして企業に対する人工知能の変革的影響により、急成長を遂げています。

明らかに、AI アプリケーションの決定に影響を与える可能性のあるデータ入力がますます増えているため、組織は関連性と影響力のあるコンテンツを選別する必要があります。ただし、組織がデータ管理に人間主導のアプローチを採用する前に、次の質問を検討してください。

AIから何を得たいと考えていますか?

<<:  「システムアーキテクチャ」マイクロサービスサービス劣化

>>:  人工知能について知っておくべき4つのこと!

ブログ    

推薦する

2022年、人工知能が未来への新たなパスワードを開く

大型家電や自動車を購入するとき、インテリジェント音声機能が搭載されているかどうかを尋ねますか?はい、...

人工知能革命は雇用を創出するのか、それとも雇用を破壊するのか?

技術革命への懸念私たちは技術革命を心配すべきでしょうか、それとも期待すべきでしょうか。一方では、技術...

次元削減アルゴリズムについて: PCA主成分分析

機械学習の分野では、生データから特徴を抽出する際に、高次元の特徴ベクトルが得られることが多いです。こ...

アラスカ航空は人工知能を活用して時間、燃料、費用を節約

[[405121]] 【51CTO.com クイック翻訳】企業の AI プロジェクトの失敗率が 85...

データに飽きた?人工知能は良い選択です

今日のデジタル マーケティング担当者にとっての課題は、共感を得るためにすべてのプラットフォームでブラ...

AIの5つの本当の危険性

偽造品、アルゴリズムの偏り、その他の問題が私たちの日常生活に及ぼす影響過去数年間、人工知能は私たちの...

Nvidiaのアルゴリズムが破られ、RTX30シリーズはマイニング計算能力を100%回復:グラフィックカードの値下げは終わったのか?

GPUマイニングで米国証券取引委員会から罰金を科されたNvidiaは、最近、暗号化アルゴリズムが解...

YouTubeの推奨アルゴリズムは潜在的に有害な動画を優先すると言われている

Mozilla の調査により、YouTube の推奨アルゴリズムは、ヘイトスピーチ、政治的および科学...

自然言語処理のためのニューラルネットワークモデルに関する予備的研究

ディープラーニング技術は、自然言語処理 (NLP) の分野に大きな影響を与えます。しかし、初心者の場...

人工知能教育とは何ですか?将来の教育の顕著な特徴は何でしょうか?

グローバル情報化教育の時代において、教育モデル、教育内容、学習方法は大きな変化を遂げており、人工知能...

分散ストレージシステムのデータ分散アルゴリズムを簡単に見てみましょう。

序文分散ストレージ システムが直面する主な問題は、大量のデータを異なるストレージ ノードに分散する方...

...

産業用ロボットの開発動向

産業用ロボットは、さまざまな産業用タスクを自動的に実行できる一種の機器として、製造、組み立て、梱包、...

...

中国は人工知能(AI)で世界をリードしており、多くの技術が世界をリードしている。

[[217124]] [[217125]] [[217126]]ディープラーニングは最も急速に成長...