エンタープライズ AI の大きな課題を解決する方法

既存のデータの 90% は過去 2 年間に生成されたものです。毎日 7.5 京バイトのデータが生成されます。これは 1 人あたり約 147,000 ギガバイトに相当します。これらの数字は驚異的ですが、予想通りです。世界は成長しており、機械経済も同様に飛躍的に成長しています。

ただし、このデータすべてがすぐに役立つというわけではありません。組織は、徹底的な事前処理を行わずにこれらのリソースを単純に利用することはできませんが、その作業を行っている人はいるでしょうか? Forrester のレポートによると、大企業では、データの 73% が分析用に未処理のままになっています。ビジネス戦略とデータ戦略の間には依然として大きなギャップがあり、組織の予測ソリューションは、最初の問題ステートメントと同じくらいしか確固たるものにはなりません。ガートナーによると、組織は AI の価値を実現するために、具体的なユースケースを確立し、測定可能な結果をもたらすテクノロジーを導入する必要があります。

データは課題である

この比喩は今でも当てはまります。データは新しい石油です (ただし、この用語が作られたのは遅くとも 2006 年なので、それほど「新しい」とは言えないかもしれません)。新品同様の状態なので、間違いなく価値があります。精製されるとさらに価値が高まります。しかし、特定の問題を解決するために設計された製品に変換されると、その用途は無数に広がり、その価値は急速に高まります。

データについても同じことが言えます。組織は、ここでの最終的な目標はできるだけ多くのデータを収集することではないことを覚えておく必要があります。データから価値を抽出し、それを特定のビジネス上の問題に適用する必要があります。データを観察し、そこから学習し、そのフィードバックに基づいて作業を自動化するという考え方が、機械学習の核心です。

[[326584]]

> GIF は giphy から

ハリウッドではよくこのように描写されるが、ML は「ターミネーター仮説」を証明する方向には進んでいない。

機械学習について学ぶ

組織がデータ駆動型になるには、まず基本を理解することが重要です。機械学習の最終的な目標は、リアルタイムのダッシュボードに表示されるデータをグラフ化して視覚化することであるとよく考えられます。 ML は、統計を表示するだけでなく、タスクを自動化する (仕事を置き換えることではない) ことが目的です。大まかに言えば、機械学習はコンピューターに世界について教え、機械がその知識を使用して他のタスクを実行できるようにします。一方、統計は人々に世界についての情報を教え、より広い視野で物事を捉え、情報に基づいた意思決定を行えるようにします。

Accenture によると、AI を戦略的に拡大する企業は、概念実証を追求している企業と比較して、AI 投資の収益がほぼ 3 倍であると報告しています。明らかに、ML は単なるダッシュボードではありません。組織が人間の知能を模倣、拡張、強化して「機械知能」を実現できるインテリジェントシステムを構築し、組織内の人々が人間に適した問題の解決に集中できるように支援します。

しかし、ほとんどの組織はスケーラブルな AI ソリューションの実装に苦労しており、そこから得られるメリット (つまり、金銭) を享受できていません。問題は、あなたの組織には人材が不足しているのではなく、戦略が不足しているということです。まだ納得できないですか? 数字を見てみましょう。

スケーラブルなソリューション

データサイエンス職の需要は 2015 年以降 344% 増加しました。組織がデータサイエンスチームの拡大に投資していることは明らかであり、データサイエンティストを雇用し続ければ、イノベーションとデジタル変革が自動的に副産物として生まれるという印象を与えます。しかし、使用されている企業データはわずか 27% であり、外部データを考慮するとさらに衝撃的です。世界で利用可能なすべてのデータのうち、分析に使用されているのは 1% 未満です。

これらすべてのデータには転換点があります。企業は、インターネットをくまなく調べてデータを探し、準備する大規模なデータチームを構築するために数百万ドルを費やすことができますが、これは決してスケーラブルなソリューションではなく、管理戦略の欠如によりボトルネックが発生します。

企業が AI と ML を導入するには何が必要ですか?

では、プロセスはどこから始まり、組織は実際にどのようにして成功する機械学習プロジェクトを構築し、展開するのでしょうか?

（１）結末から始めましょう。直面している問題と達成したい解決策を明確に理解する必要があります。ボウリングでは、1 つのボールで 10 本のピンを倒すことができますが、ボールを正しい方向に投げれば、パーフェクトゲームになります。 ML を使用する場合は、目標を理解する必要があります。組織は目標主導型であり、常に収益の増加と KPI の改善を目指しています。質問がそれらの目標に対応していない場合は、おそらく目標から外れてしまうでしょう。

（２）適切な質問をする。ほとんどの企業は、ML の問題を解決しようとする前に適切な質問をしません。何が答えられ、何が答えられないかを分析および理解し、予測システムがエンドユーザーに本当にどのようなメリットをもたらすかを理解します。尋ねるべき重要な質問: 「私のプロジェクトは、組織に生み出す価値によって深く推進されているか?」

（３）事業戦略を定義する。他のプロジェクトに適用されるデータおよび ML プロジェクトでも、同じ戦略策定の詳細を実装する必要があります。プロジェクトの成功を追跡するのに役立つ、具体的で測定可能かつ達成可能な目標、実装計画、指標が必要です。プロジェクトを技術的な観点から見るだけでは不十分で、ソリューションを組織に結び付ける必要があります。たとえば、モデルを実装した後、会社の収益は増加しますか、それとも市場で確固たる競争上の優位性を獲得しますか?

（4）適切なチームを構築する。組織が適切な候補者を採用できない理由は、何を達成したいのかがわかっていなかったり、データサイエンティストの役割について相反する認識を持っていたりするからです。データチームは、データサイエンティストだけでなく、多くの役割で構成されています。1 つの役割で、ウェアハウスの構築と維持、データワークフローの設計、完璧に最適化された機械学習アルゴリズムの作成、すべてを分析できると考えるのは無知です。プロジェクトに適切な役割を埋めるためには、目標を明確に定義し、各技術的役割/チーム構造のニュアンスを理解し、これらすべてが求人広告に記載されていることを確認する必要があります。次のグラフは、データサイエンスの新たな役割におけるコアスキルの相対的な重要性を示しています。

> データサイエンスにおけるスキルの重要度チャート

（５）データ戦略ロードマップを作成する。データは、ML プロジェクトでモデルをトレーニングするための重要な資産です。人工知能分野の先駆者であるアンドリュー・ン氏によると、最も大きく、最も成功した製品には最も多くのユーザーがいるそうです。通常、ユーザー数が多いということは、最も多くのデータが得られるということであり、最新の ML では、データが最も多いということは、優れた AI を作成できることを意味します。次の図は上記の概念を説明しています。

（６）サードパーティソフトウェアの使用。現状を根本から変えて、社内データパイプラインを構築しようとしないでください。 AI を成功裏に導入するには、データのソーシング、クロール、標準化、最適化、統合において自動化できるタスクを組織が完了するのに役立つ適切なツールを選択することが重要です。 Alegion の依頼で実施された Dimensional Research のレポートによると、最終的に 71% のチームがトレーニングデータやその他の機械学習プロジェクトアクティビティをアウトソーシングしていることがわかりました。「構築 vs. 購入」の議論では、「構築」を選択する企業はより多くの時間と費用を費やします。覚えておいてください。雇うのはデータ管理者ではなく、データサイエンティストです。 DataOps ツールを導入し、データライフサイクルの準備段階と処理段階の両方を自動化する方法を見つけることで、洞察を得るまでの時間が短縮されます。

決して簡単ではありませんが、難しい必要はありません

十分なデータを持っていない企業もあれば、10 年以上も使用できない価値に苦しんでいる企業もあります。データを持っているからといって、自動的にそこから洞察を得られるというわけではありません。組織はデータから洞察を得るために必要な準備を認識しておらず、その結果、イノベーションと成長のボトルネックが増加しています。データがないのではなく、利用可能なデータがあるのです。

データは予測的かつインテリジェントなソリューションを作成する上で重要な要素ですが、データはそれだけではありません。問題を見つけ、その問題を解決するのに適した人材を見つけ、その問題を効果的に解決してその効果を測定するために必要なツールを彼らに提供すること — これらが ML を成功させるための要件です。

<<: インテリジェントな音声対話サービスはますます良くなり、従順であることも芸術である

>>: 衛星と機械学習はどのようにして海洋のプラスチック廃棄物を検出できるのでしょうか?