AIのジレンマをどう解決するか?

AIのジレンマをどう解決するか?

今日の大手企業が AI におけるいくつかの大きな課題をどのように克服しているか。

概要:多くの企業はビジネスを変革し、競争上の優位性を構築しようとしており、AI テクノロジーに多額の投資を行っています。複数の業界の多国籍企業のデータサイエンスおよびエンジニアリング チームのリーダーを対象とした調査では、約 90% が AI に多額の投資を行っているものの、投資のメリットを十分に享受している企業はほとんどないことがわかりました。

AI プロジェクトのうち成功するのはわずか 3 分の 1 で、構想段階から実稼働段階までに 6 か月以上かかり、実稼働段階にまったく至らないプロジェクトも相当数あり、企業組織に AI のジレンマをもたらしています。

データは AI を可能にしますが、実装も困難にします。約 96% の企業が、AI プロジェクトが実稼働段階に入るときに最もよくある障害はデータ関連の課題であると述べています。エンタープライズ データは AI に対応しておらず、データ ウェアハウス、データ レイク、データベース、ファイル システムなど、数百のシステムに分散しています。 TensorFlow などの機械学習フレームワークはデータ処理を行いません。

データ システムは「AI を実行」せず、これらの AI テクノロジーは「データを処理」しないため、企業は平均 7 つの異なるツールを使用することになり、摩擦が生じてプロジェクトが妨げられます。さらに悪いことに、調査では、データサイエンスチームとエンジニアリングチームが独立した部門に配置されているため、80% の企業がデータコラボレーションの課題に直面していることがわかりました。

では、これらの企業が AI ジレンマを克服するために何が期待されているのでしょうか? 調査によると、回答者の 90% が統合分析によって AI ジレンマを解決できると考えています。このアプローチは、データ処理と機械学習フレームワークを統合し、機械学習ライフサイクル全体を通じてデータ サイエンス チームとデータ エンジニアリング チーム間のコラボレーションを促進します。統合分析は、データ サイエンスとデータ エンジニアリングを統合した新しいタイプのソリューションであり、企業の AI プロジェクトの実行を大幅に促進します。統合分析により、データ エンジニアはサイロ化されたシステム間でデータ パイプラインを構築し、モデリング用のラベル付きデータベースを準備することが容易になり、データ サイエンティストはデータを探索および視覚化し、モデルの構築で共同作業できるようになります。

はじめに: CIO/IDG Research Services は、AI 技術の導入を検討中または使用している欧米の大手企業 (従業員 1,000 人以上) の IT 幹部 200 名以上を対象に調査を実施しました。私たちは、AI 投資の全容、期待されるビジネス成果、課題、AI の成功を推進する要因を理解したいと考えました。

AIのジレンマ:AIへの投資の約90%、成功例はほとんどない

複数の業界の回答者が、命を救う新薬の発見、詐欺や悪意のある活動の検出、グローバルサプライチェーン管理の改善、顧客向けの高度にパーソナライズされたデジタルエクスペリエンスの創出など、データと機械学習を活用した新しいビジネスモデルを構築するために、AI プロジェクトに多大なリソースを投資していることは明らかです。

課題にもかかわらず、回答者は AI に全力で取り組んでいます。したがって、回答者の 3 分の 2 が、今後 1 年間で AI への投資が増加すると予想しているのも不思議ではありません (下のグラフを参照)。

「AI は、世界中のほとんどの企業に影響を与える破壊的イノベーションを推進する可能性を秘めています」と、Databricks の製品マーケティング担当副社長である Bharath Gowda 氏は述べています。「AI はさまざまな業界で使用されています。ゲノミクスでは、新薬の発見を加速し、個別化医療を促進するために使用されています。また、製造業では、製品の開発と提供における運用効率を向上させるために使用されています。その可能性にもかかわらず、AI プロジェクトを成功裏に拡大している企業はほとんどありません。」

データ関連の課題により、96%の企業がAIの導入に成功していない

しかし、CIO/IDG の調査では、さまざまな理由から企業が AI のメリットをまだ十分に享受できていないことが明らかになっていますが、データは確実に話題になっています。プロジェクトを本番環境に移行する際には、ほぼすべての回答者 (96%) が複数のデータ関連の課題を挙げています (下の図を参照)。

データ関連の課題に関しては、データ サイロが他の問題よりもはるかに頻繁に言及されており、技術的な複雑さが 2 番目に大きな課題となっています。

「データ サイエンティストにとって、大量のデータで作成されたシンプルなモデルは、少ないデータで作成された複雑なモデルよりも優れた結果を生み出すことが証明されています。つまり、データが多いほどモデルは良くなります。データは AI の原動力です」と Gowda 氏は言います。「データ サイエンティストがクリーンで信頼性の高いデータをすぐに利用できることが成功の鍵です。したがって、企業にとっての課題は、モデル開発のために、孤立した乱雑なデータをクリーンでラベル付けされたデータに変換することです。」

複雑化の進行: 企業は平均7つの異なる機械学習ツールを所有している

データ エンジニアリング チームとデータ サイエンス チームの違いは、使用するツールにも及び、その種類は数多くあります。

大多数 (87%) は、データの準備、データの探索、モデルの構築に役立つさまざまなデータおよび AI 関連テクノロジを取得しています。

  • 回答者の 85% が、Apache Spark、Hadoop/MapReduce、Google BigQuery などのデータ処理ツールを使用しています。
  • 回答者の 65% が Flume、Kafka、Onyx などのデータ ストリーミング ツールを使用しています。
  • 回答者の 80% が、Azure ML、Amazon ML、Spark MLlib などの機械学習ツールを使用しています。
  • 回答者の 65% が、Google TensorFlow、Microsoft CNTK、Deeplearning4j (DL4J) などのディープラーニング ツールを使用しています。

全体的に、調査結果によると、組織は平均 7 つの異なる機械学習およびディープラーニング ツールとフレームワークを使用しており、複雑な環境が生まれ、効率が低下しています。

「AI から価値を引き出すために、組織は既存のデータと、大量のデータセットに機械学習を反復的に適用する能力に依存しています」と Godda 氏は述べています。「今日のデータ エンジニアとデータ サイエンティストは、このタスクを達成するために、多数の機械学習フレームワークを含む、無数のばらばらのツールを使用しています。」

サイロ化されたデータサイエンスおよびエンジニアリングチーム: 80% が結果として生産性の低下を経験

技術的なスキル、リーダーシップ、一貫した戦略の欠如は、データ エンジニアリング チームとデータ サイエンス チームが直面する 3 つの主な障害です (下の図を参照)。

統合分析 - 多くの企業はAIのジレンマを解決するために新しいクラスのソリューションを必要としています

回答者は、そのようなツールを歓迎するだろうと明言した。ほぼ 5 人に 4 人 (79%) が、ビッグデータと AI を統合し、データ エンジニアリング チームとデータ サイエンス チーム間のコラボレーションを促進するエンドツーエンドの分析プラットフォームが非常に貴重であると述べています。

このようなプラットフォームに必要なその他の機能は次のとおりです。

  • 大規模なデータセットを処理する際の優れたパフォーマンス
  • さまざまなデータソースとの統合が組み込まれています
  • さまざまなスキルを持つデータサイエンティストが協力して作業できるコラボレーションスペース
  • 弾力的な拡張をサポートするクラウドネイティブプラットフォーム
  • 大規模なデータパイプラインを構築するための組み込みデータ管理機能
  • 複数のクラウドのサポート

<<:  インテリジェントな世界は加速していますが、真の人工知能 (AI) から私たちはどれくらい離れているのでしょうか?

>>:  ディープラーニングを始めるために理解すべき25の概念

ブログ    
ブログ    

推薦する

2026年までに世界の人工知能(AI)市場は2,390億ドルに達する

GMIリサーチの最新分析によると、人工知能市場は2019年から2026年の予測期間中に年平均成長率(...

人工知能やモノのインターネットなどの技術は、気候変動のリスクを軽減する上で大きな役割を果たすことができる。

人工知能は、既存の技術と組織活動の効率を向上させることを目的としています。しかし、気候変動や、グリー...

AIはすでにLeetCodeを実行できる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

Daguan Data: ナレッジグラフと Neo4j の簡単な分析

現在のビッグデータ業界では、アルゴリズムのアップグレード、特に機械学習の導入により、「パターン発見」...

SASは、IoTイニシアチブにAIを組み込むことで企業が競合他社を飛び越えることができると述べている

SAS の新しいレポート「AIoT – IoT リーダーが困難を脱する方法」によると、組織のモノのイ...

Quora は機械学習をどのように活用していますか?

[[202181]] 2015年、同社のエンジニアリング担当副社長であるXavier Amatri...

快手 - ICIP 2019 モバイルビデオ修復コンテストの登録開始

最近、Kuaishou-ICIP 2019モバイルビデオ復元コンテストの登録が正式に開始されました。...

YOLOがBEVセンシングに参入! YOLO+BEVのリアルタイム検出の試み

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

Googleの研究ディレクターはスタンフォード大学で教鞭をとり、「人工知能:現代的アプローチ」の著者でもある。

スタンフォード大学は10月11日、Googleリサーチディレクターのピーター・ノーヴィグ氏がスタンフ...

画像を外国語として扱うKuaishouと北京大学のマルチモーダル大規模モデルはDALLE-3に匹敵する

GPT や LLaMA などの現在の大規模言語モデルは、自然言語処理の分野で大きな進歩を遂げており、...

...

AIがエンタープライズデータカタログを救う方法

「データ カタログ」という概念は、実は新しいものではありません。メインフレームの時代から、企業はデー...

76ページのレビュー+300以上の参考文献で、Tiandaチームは大規模言語モデルアライメント技術を包括的に紹介しています。

最近、天津大学の熊徳一教授のチームが大規模言語モデルアライメント技術に関するレビュー論文(以下、アラ...

効率的なコーディングのための 5 つの IntelliJ IDEA プラグイン

人工知能(AI)は現在、将来のトレンドと発展の方向性として広く認識されています。 AI がすべての仕...

Python を使用したソーシャル メディア感情分析の入門

[[265146]]自然言語処理の基礎を学び、2 つの便利な Python パッケージを調べます。自...