エンタープライズ AI の大きな課題を解決する方法

エンタープライズ AI の大きな課題を解決する方法

既存のデータの 90% は過去 2 年間に生成されたものです。 毎日 7.5 京バイトのデータが生成されます。これは 1 人あたり約 147,000 ギガバイトに相当します。 これらの数字は驚異的ですが、予想通りです。世界は成長しており、機械経済も同様に飛躍的に成長しています。

ただし、このデータすべてがすぐに役立つというわけではありません。 組織は、徹底的な事前処理を行わずにこれらのリソースを単純に利用することはできませんが、その作業を行っている人はいるでしょうか? Forrester のレポートによると、大企業では、データの 73% が分析用に未処理のままになっています。 ビジネス戦略とデータ戦略の間には依然として大きなギャップがあり、組織の予測ソリューションは、最初の問題ステートメントと同じくらいしか確固たるものにはなりません。 ガートナーによると、組織は AI の価値を実現するために、具体的なユースケースを確立し、測定可能な結果を​​もたらすテクノロジーを導入する必要があります。

データは課題である

この比喩は今でも当てはまります。データは新しい石油です (ただし、この用語が作られたのは遅くとも 2006 年なので、それほど「新しい」とは言えないかもしれません)。 新品同様の状態なので、間違いなく価値があります。 精製されるとさらに価値が高まります。 しかし、特定の問題を解決するために設計された製品に変換されると、その用途は無数に広がり、その価値は急速に高まります。

データについても同じことが言えます。組織は、ここでの最終的な目標はできるだけ多くのデータを収集することではないことを覚えておく必要があります。 データから価値を抽出し、それを特定のビジネス上の問題に適用する必要があります。 データを観察し、そこから学習し、そのフィードバックに基づいて作業を自動化するという考え方が、機械学習の核心です。

[[326584]]

> GIF は giphy から

ハリウッドではよくこのように描写されるが、ML は「ターミネーター仮説」を証明する方向には進んでいない。

機械学習について学ぶ

組織がデータ駆動型になるには、まず基本を理解することが重要です。 機械学習の最終的な目標は、リアルタイムのダッシュボードに表示されるデータをグラフ化して視覚化することであるとよく考えられます。 ML は、統計を表示するだけでなく、タスクを自動化する (仕事を置き換えることではない) ことが目的です。 大まかに言えば、機械学習はコンピューターに世界について教え、機械がその知識を使用して他のタスクを実行できるようにします。 一方、統計は人々に世界についての情報を教え、より広い視野で物事を捉え、情報に基づいた意思決定を行えるようにします。

Accenture によると、AI を戦略的に拡大する企業は、概念実証を追求している企業と比較して、AI 投資の収益がほぼ 3 倍であると報告しています。 明らかに、ML は単なるダッシュボードではありません。組織が人間の知能を模倣、拡張、強化して「機械知能」を実現できるインテリジェント システムを構築し、組織内の人々が人間に適した問題の解決に集中できるように支援します。

しかし、ほとんどの組織はスケーラブルな AI ソリューションの実装に苦労しており、そこから得られるメリット (つまり、金銭) を享受できていません。 問題は、あなたの組織には人材が不足しているのではなく、戦略が不足しているということです。 まだ納得できないですか? 数字を見てみましょう。

スケーラブルなソリューション

データサイエンス職の需要は 2015 年以降 344% 増加しました。 組織がデータ サイエンス チームの拡大に投資していることは明らかであり、データ サイエンティストを雇用し続ければ、イノベーションとデジタル変革が自動的に副産物として生まれるという印象を与えます。 しかし、使用されている企業データはわずか 27% であり、外部データを考慮するとさらに衝撃的です。世界で利用可能なすべてのデータのうち、分析に使用されているのは 1% 未満です。

これらすべてのデータには転換点があります。 企業は、インターネットをくまなく調べてデータを探し、準備する大規模なデータチームを構築するために数百万ドルを費やすことができますが、これは決してスケーラブルなソリューションではなく、管理戦略の欠如によりボトルネックが発生します。

企業が AI と ML を導入するには何が必要ですか?

では、プロセスはどこから始まり、組織は実際にどのようにして成功する機械学習プロジェクトを構築し、展開するのでしょうか?

(1)結末から始めましょう。 直面している問題と達成したい解決策を明確に理解する必要があります。 ボウリングでは、1 つのボールで 10 本のピンを倒すことができますが、ボールを正しい方向に投げれば、パーフェクト ゲームになります。 ML を使用する場合は、目標を理解する必要があります。 組織は目標主導型であり、常に収益の増加と KPI の改善を目指しています。質問がそれらの目標に対応していない場合は、おそらく目標から外れてしまうでしょう。

(2)適切な質問をする。 ほとんどの企業は、ML の問題を解決しようとする前に適切な質問をしません。 何が答えられ、何が答えられないかを分析および理解し、予測システムがエンドユーザーに本当にどのようなメリットをもたらすかを理解します。 尋ねるべき重要な質問: 「私のプロジェクトは、組織に生み出す価値によって深く推進されているか?」

(3)事業戦略を定義する。 他のプロジェクトに適用されるデータおよび ML プロジェクトでも、同じ戦略策定の詳細を実装する必要があります。 プロジェクトの成功を追跡するのに役立つ、具体的で測定可能かつ達成可能な目標、実装計画、指標が必要です。 プロジェクトを技術的な観点から見るだけでは不十分で、ソリューションを組織に結び付ける必要があります。 たとえば、モデルを実装した後、会社の収益は増加しますか、それとも市場で確固たる競争上の優位性を獲得しますか?

(4)適切なチームを構築する。 組織が適切な候補者を採用できない理由は、何を達成したいのかがわかっていなかったり、データ サイエンティストの役割について相反する認識を持っていたりするからです。 データ チームは、データ サイエンティストだけでなく、多くの役割で構成されています。1 つの役割で、ウェアハウスの構築と維持、データ ワークフローの設計、完璧に最適化された機械学習アルゴリズムの作成、すべてを分析できると考えるのは無知です。 プロジェクトに適切な役割を埋めるためには、目標を明確に定義し、各技術的役割/チーム構造のニュアンスを理解し、これらすべてが求人広告に記載されていることを確認する必要があります。 次のグラフは、データ サイエンスの新たな役割におけるコア スキルの相対的な重要性を示しています。

> データサイエンスにおけるスキルの重要度チャート

(5)データ戦略ロードマップを作成する。 データは、ML プロジェクトでモデルをトレーニングするための重要な資産です。 人工知能分野の先駆者であるアンドリュー・ン氏によると、最も大きく、最も成功した製品には最も多くのユーザーがいるそうです。 通常、ユーザー数が多いということは、最も多くのデータが得られるということであり、最新の ML では、データが最も多いということは、優れた AI を作成できることを意味します。 次の図は上記の概念を説明しています。

(6)サードパーティソフトウェアの使用。 現状を根本から変えて、社内データ パイプラインを構築しようとしないでください。 AI を成功裏に導入するには、データのソーシング、クロール、標準化、最適化、統合において自動化できるタスクを組織が完了するのに役立つ適切なツールを選択することが重要です。 Alegion の依頼で実施された Dimensional Research のレポートによると、最終的に 71% のチームがトレーニング データやその他の機械学習プロジェクト アクティビティをアウトソーシングしていることがわかりました。 「構築 vs. 購入」の議論では、「構築」を選択する企業はより多くの時間と費用を費やします。 覚えておいてください。雇うのはデータ管理者ではなく、データ サイエンティストです。 DataOps ツールを導入し、データ ライフサイクルの準備段階と処理段階の両方を自動化する方法を見つけることで、洞察を得るまでの時間が短縮されます。

決して簡単ではありませんが、難しい必要はありません

十分なデータを持っていない企業もあれば、10 年以上も使用できない価値に苦しんでいる企業もあります。 データを持っているからといって、自動的にそこから洞察を得られるというわけではありません。 組織はデータから洞察を得るために必要な準備を認識しておらず、その結果、イノベーションと成長のボトルネックが増加しています。 データがないのではなく、利用可能なデータがあるのです。

データは予測的かつインテリジェントなソリューションを作成する上で重要な要素ですが、データはそれだけではありません。 問題を見つけ、その問題を解決するのに適した人材を見つけ、その問題を効果的に解決してその効果を測定するために必要なツールを彼らに提供すること — これらが ML を成功させるための要件です。

<<:  インテリジェントな音声対話サービスはますます良くなり、従順であることも芸術である

>>:  衛星と機械学習はどのようにして海洋のプラスチック廃棄物を検出できるのでしょうか?

ブログ    
ブログ    
ブログ    

推薦する

小さなターゲットを検出するためのディープラーニングの一般的な方法

[[427475]]導入ディープラーニングによる物体検出、特に顔検出では、解像度が低い、画像がぼやけ...

...

ChatGPT に触発されて、Google DeepMind は 7100 万の遺伝子変異を予測します。 AIが人間の遺伝学を解読

タンパク質予測モデルAlphaFoldがAIの世界に津波のような波を起こした後、Alphaファミリー...

...

Java でアルゴリズムを実装する場合は、再帰に注意してください。

現象:再帰は、アルゴリズムの原理をうまく説明できる古典的なアルゴリズム実装です。再帰は、アルゴリズム...

6つの新しいことに焦点を当て、新境地を開拓し、プロジェクトは変革を促進するための王様です。2020年中国(太原)人工知能会議が開催されました

2002年から2012年までの石炭の「黄金の10年」を経験した後、「古い工業基地」である山西省太原市...

...

【ディープラーニング連載】畳み込みニューラルネットワークの徹底解説(第2回)~畳み込みニューラルネットワークを手書きで書いてみる~

前回の記事では、畳み込みニューラルネットワークの基本原理について、いくつかの基本層の定義、動作ルール...

...

百度地図のデータ収集リンクの80%はAIベースになっており、旅行業界はインテリジェントにアップグレードされている

人工知能時代の地図データ制作はどのような変化を遂げるのでしょうか?7月3日、「Baidu Creat...

...

...

「AI+」が世界を変える!さまざまな分野における 5 つの主要な AI トレンド

人工知能は現代世界で最も注目され、最も議論されているトピックであり、20年後には人々の世界観を変える...

合成データとAIの「非現実的な」世界を探る

最近、アクセンチュアは「メタバースで出会う:テクノロジーとエクスペリエンスの連続体のビジネスを再構築...

...