データサイエンスと機械学習の違いは何ですか?

データサイエンスと機械学習の違いは何ですか?

機械学習は人工知能 (AI) の分野であり、データサイエンスはデータのクリーニング、準備、分析の分野です。人々は、それぞれのテクノロジーがどのように機能し、どのように連携するかを理解する必要があります。

[[324839]]

機械学習 (ML) とデータ サイエンスはよく一緒に言及されますが、それには十分な理由があります。これら 2 つのテクノロジーは互いに補完し合いますが、それらがどのように機能し、どのように連携できるかを理解することが重要です。

機械学習は人工知能 (AI) の分野であり、コンピューターがデータから自ら学習し、人間の介入なしにその学習を適用できるようにします。

「本質的に、データサイエンスは実践分野であり、機械学習はツールと方法論のセットです」と、ビジネス変革およびアウトソーシングコンサルティング会社である Pace Harmon のプリンシパルである JP Baritugo 氏は述べています。「データサイエンスは、幅広い専門知識、ビジネス知識、ツール、および方法を使用してビッグデータを処理し、アクションを促進し、有意義なビジネス成果を達成する有意義な洞察を生み出します。」

機械学習にデータサイエンスが必要な理由

効果的な機械学習には優れたデータサイエンスが必要です。 「企業は、機械学習が正しく使用され、展開されるようにするために、データ サイエンティストの専門知識を必要としています」とバリトゥゴ氏は言います。データ サイエンティストは、モデルにトレーニング用のクリーンアップされ正規化されたデータセットが提供され、データセットと解決するビジネス上の問題に基づいて正しいアルゴリズムが使用されるようにすることができます。

「データサイエンスは、機械学習の領域を超えて応用できます」と、データサイエンス プラットフォーム RapidMiner の創設者兼社長である Ingo Mierswa 氏は語ります。「データサイエンスとは、人工知能、機械学習、ディープラーニング、およびビジネス環境におけるデータ準備の実用化です。データサイエンスの目標は、データから洞察を引き出し、将来の展開を予測し、アクションを提案すること (場合によってはそれらのアクションを自動化すること) であり、これは人工知能や機械学習などのツールによって実現されます。」

基本的に、データ サイエンティストは複数のソースからデータセットを収集して準備し、何らかの関数を適用してそこから洞察を抽出します。場合によっては、機械学習に手を染めることもあります。他の場合には、より根本的な分析が必要になる場合があります。 「少なくとも私の意見では、データサイエンスは単なるデータの操作です」とISGの自動化およびイノベーション担当ディレクター、ウェイン・バターフィールド氏は語る。

機械学習を使うべきタイミング

解決策が大量のデータの中に隠されている状況に直面した場合、機械学習は強力なツールになります。 「機械学習は、人間の作業員が行うのにかかる時間のほんの一部でデータを処理し、そこからパターンを抽出し、他の方法では得られない洞察を得るのに優れています」とミアスワ氏は語った。

たとえば、機械学習(データサイエンスに基づく)は、金融サービスにおけるリスク分析、不正検出、ポートフォリオ管理、GPS ベースの移動予測、Amazon や Netflix の製品やコンテンツの推奨に役立っています。

「機械学習は、すでに適切にラベル付けされた履歴データが大量にある場合や、データを非常に迅速にシミュレートできる場合の問題に最適です」とバターフィールド氏は言います。「トレーニングに十分なデータがない場合、機械学習を使用するには長い時間がかかります。」

「機械学習モデルの良し悪しは、学習元となるデータの質次第であり、世の中には大量のデータが存在するさまざまなタイプの問題が存在する」と、ミシガン工科大学コンピュータサイエンス学部のコンピュータシステム准教授で、コンピューティングおよびサイバーシステム研究所所長のティモシー・ヘイブンス氏は述べた。

「特定の問題は機械学習に適しています」とバターフィールド氏は説明します。「たとえば、データ サイエンス (機械学習は含みません) は長年予測や計画に応用されてきましたが、精度には限界がありました。天気、過去の病気のパターン、外部イベント、過去の需要など、複数のデータ ソースを考慮できる高度なアルゴリズムを構築できるようになったため、日単位だけでなく、おそらく 1 時間単位でも、はるかに正確な予測を得ることができます。」

金融サービスでは、機械学習とデータサイエンスが保険や詐欺防止のための強力なソリューションを提供できます。 IT アプリケーションでは、ネットワーク管理を改善できます。医療機関は、機械学習とデータ サイエンスを適用して、診断の精度を向上させ、最適な価格と量の組み合わせを決定したり、患者の転帰を予測したりすることができます。顧客体験管理では、顧客とのやり取りを改善し、顧客生涯価値を予測し、顧客離れを見積もるために協力します。小売業者はそれらを使用して需要を予測できます。価格設定を最適化し、顧客をセグメント化します。製造業では、データ サイエンスと機械学習を使用して、サプライ チェーンを自動化し、計画を改善できます。

データサイエンスだけで十分なとき

AI を取り巻く技術的アプリケーションにより、あらゆるビジネス上の問題が機械学習を導入するチャンスのように見え始めています。しかし、多くの場合、機械学習は適切に機能しないか、より大きな損害を引き起こす可能性があります。

エベレスト グループの副社長であるアニル ビジャヤン氏は、「データ サイエンスだけで十分な場合もあります。境界があいまいなため、データ サイエンスと機械学習を明確に区別することは困難です。結局のところ、ほとんどのアルゴリズムは統計的手法を使用しています。すべての問題を解決するために人工知能が必要なわけではありません。多くの場合、従来のデータ サイエンスを使用すれば十分であるだけでなく、より効率的である可能性もあります」と述べています。

ビジャヤン氏は、出力が比較的少数のパラメータに依存し、それらのパラメータが時間の経過とともにあまり変化しない状況では、従来のデータサイエンス手法(機械学習を使用しない)の方が効果的かもしれないと述べた。さらに、出力とパラメータの関係が十分に理解されており、変化する可能性が低い場合は、データ サイエンスのみを採用するだけで十分です。

<<:  インテル、IoTとエッジ向け第10世代プロセッサーを発表

>>:  ワンクリックで顔のピクセル画像を生成し、Animal Crossingにアップロードしましょう!このプロジェクトは楽しい

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

ChatGPTはPyTorchなしでは構築できません。LeCunの発言は白熱した議論を引き起こしました。モデルメーカーが重量を公開しない理由は、

ここ2日間で、オープンソースの話題が再び人気を集めています。 「オープンソースがなければ、AI は何...

ポストコロナ時代の住宅建設において、スマート建築はどのように変化するのでしょうか?

スマート コンストラクションは、最適化されたプロセス、モデリング、仮想現実、3D レンダリング、監視...

...

Microsoft Flight SimulatorはAIを使って15億の建物を復元、宮殿がオフィスビルに変わる際にバグが発生

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

...

AIとIoTでモダンな職場を構築する方法

ビジネスリーダーは、従業員の生産性、パフォーマンス、安全性を向上させるために、人工知能 (AI) と...

業界最高品質の AI データを作成するにはどうすればよいでしょうか?クラウドデータの成功の秘密を明かす

[[344160]] AIの実装が加速する中、AIデータのラベリングは人工知能産業の実装における重要...

...

ディープニューラルネットワーク (DNN) は人間の大脳皮質の構造をシミュレートしますか?

[[199788]]私は生物学を専攻する学部生であり、認知神経科学を専攻する大学院生です。余暇には...

ソフトウェア開発は最終的に時代遅れになるのでしょうか?

[[283217]] [51CTO.com クイック翻訳] 著名なベンチャーキャピタリスト、マーク...

Microsoft Office Family Bucket Edition GPT-4 の価格は月額 30 ドル、Azure は Llama 2 と提携

ここ数カ月、国内外のテクノロジー大手は大規模モデルをめぐって動きを見せているが、OpenAIを所有す...

...

...

AIが狂って縁石にぶつかる! Pony.aiの完全自動運転の路上テストは「失敗」に終わった

近年、中国の「新車製造勢力」のインテリジェント運転分野における宣伝・マーケティング活動とビジネス成果...