クラウドで必要な 5 つの機械学習スキル

クラウドで必要な 5 つの機械学習スキル

機械学習と AI は IT サービスにさらに深く浸透し、ソフトウェア エンジニアが開発したアプリケーションを補完し続けています。 IT チームが追いつきたいのであれば、機械学習のスキルを向上させる必要があります。

クラウド コンピューティング サービスは、AI および機械学習アプリケーションの構築と展開のためのさまざまな機能をサポートします。多くの点で、AI システムの管理は、IT プロフェッショナルがクラウド内で使い慣れている他のソフトウェアと非常によく似ています。ただし、アプリケーションをデプロイできるからといって、必ずしも機械学習モデルを正常にデプロイできるとは限りません。

[[349722]]

これらの共通点により移行が加速される可能性がありますが、依然として重要な違いも存在します。ソフトウェア エンジニアリングのスキルに加えて、IT チームのメンバーには特定の機械学習と AI の知識も必要になります。技術的な専門知識に加えて、チームの取り組みをサポートするために現在利用可能なクラウド コンピューティング ツールを理解する必要があります。

クラウドで AI を効果的に活用するために IT プロフェッショナルが必要とする 5 つの機械学習スキルを探り、これらのスキルをサポートするために Amazon、Microsoft、Google が提供する製品について学びましょう。これらのスキルセットには重複する部分もありますが、1 人の人間がすべてを習得できるとは期待しないでください。これらのスキルを持つ人材のチームを構築することで、クラウドベースの機械学習を最大限に活用できる最適な立場にビジネスを置くことができます。

1. データエンジニアリング

IT プロフェッショナルがクラウドであらゆる種類の AI 戦略を実装したい場合は、データ エンジニアリングを理解する必要があります。データ エンジニアリングには、データ ラングリングやワークフロー開発などの分野から、ソフトウェア アーキテクチャの知識まで、さまざまなスキルが含まれます。

これらのさまざまな IT 専門知識の領域は、IT プロフェッショナルが達成すべきさまざまなタスクに分類できます。たとえば、データ ラングリングには通常、データ ソースの識別、データの抽出、データ品質の評価、データの統合、および実稼働環境でこれらの操作を実行するためのパイプラインの開発が含まれます。

データ エンジニアは、リレーショナル データベース、NoSQL データベース、オブジェクト ストレージ システムの操作に慣れている必要があります。 Python は、Apache Beam などのバッチおよびストリーム処理プラットフォームや、Apache Spark などの分散コンピューティング プラットフォームと組み合わせて使用​​される、人気のプログラミング言語です。熟練した Python プログラマーでなくても、言語に関するある程度の知識があれば、データ エンジニアリングや機械学習用のさまざまなオープン ソース ツールからスキルを向上させることができます。

データ エンジニアリングはすべての主要なクラウドで十分にサポートされています。 AWS は、AWS Glue、Amazon Managed Streaming for Apache Kafka (MSK)、さまざまな Amazon Kinesis サービスなど、データエンジニアリングをサポートする包括的なサービスを提供しています。 AWS Glue は、スケジュールされたジョブのサポートを含むデータカタログおよび抽出、変換、ロード (ETL) サービスです。 MSK はデータ エンジニアリング パイプラインの便利な構成要素であり、Kinesis サービスはスケーラブルなストリーム処理パイプラインのデプロイに特に役立ちます。

Google Cloud Platform は、バッチ処理とストリーム処理をサポートするマネージド Apache Beam サービスである Cloud Dataflow を提供しています。 ETL プロセスの場合、Google Cloud Data Fusion は Hadoop に基づくデータ統合サービスを提供します。 Microsoft Azure では、Azure Cosmos DB、Data Catalog、Data Lake Analytics など、さまざまな管理データ ツールも提供されています。

2. モデル構築

機械学習は十分に発達した分野であり、機械学習アルゴリズムを研究および開発することでキャリアを築くことができます。

IT チームは、エンジニアが提供するデータを使用してモデルを構築し、推奨事項の作成、値の予測、アイテムの分類を行うソフトウェアを作成します。モデル構築プロセスの多くはクラウド内で自動的に実行されますが、機械学習技術の基礎を理解することが重要です。

モデルビルダーとして、データとビジネス目標を理解する必要があります。問題を解決するためのソリューションを構想し、それを既存のシステムと統合する方法を理解する必要があります。

現在、市場には Google の Cloud AutoML などの既成製品が存在します。これは、機械学習についてあまり知らなくても、構造化データ、画像、動画、自然言語を使用してカスタム モデルを構築できる一連のサービスです。 Azure は Visual Studio で ML.NET モデル ビルダーを提供しており、モデルの構築、トレーニング、デプロイのためのインターフェイスを提供します。

Amazon SageMaker は、クラウドで機械学習モデルを構築およびデプロイするためのもう 1 つのマネージドサービスです。 これらのツールは、アルゴリズムを選択し、データ内のどの機能または属性が最も価値があるかを判断し、ハイパーパラメータ調整と呼ばれるプロセスを使用してモデルを最適化できます。これらのサービスにより、機械学習と AI 戦略の潜在的な用途が拡大します。車を運転するのに機械工学のエンジニアである必要がないのと同じように、効果的なモデルを構築するのに機械学習の大学院の学位は必要ありません。

3. 公平性と偏りの検出

アルゴリズムによって下された決定は、個人に直接かつ重大な影響を及ぼします。たとえば、金融サービスでは AI を使用して信用に関する決定を下しますが、その決定によって意図せず特定のグループの人々に有利になることがあります。これは、個人への信用を拒否することで個人に損害を与えるだけでなく、金融機関が信用機会均等法などの規制に違反するリスクにもつながります。

これらの一見困難なタスクは、AI および機械学習モデルにとって避けられないものです。モデル内のバイアスを検出するには、高度な統計および機械学習のスキルが必要になる場合がありますが、モデルの構築と同様に、面倒な作業の一部は機械で行うことができます。

FairML は予測モデルを監査するためのオープンソース ツールであり、開発者が作業中の偏りを特定するのに役立ちます。モデルのバイアス検出に関する経験は、データ エンジニアリングとモデル構築のプロセスにも役立ちます。 Google Cloud は、What-If ツール、公平性インジケーター、説明可能な AI サービスなどの公平性ツールで市場をリードしています。

4. モデルのパフォーマンス評価

モデル構築プロセスの一部は、機械学習モデルのパフォーマンスを評価することです。たとえば、分類分析は、精度、適合率、再現率に基づいて評価されます。回帰モデル(住宅の販売価格を予測するモデルなど)は、平均エラー率を測定することによって評価されます。

現在パフォーマンスが良いモデルでも、将来はパフォーマンスが悪くなる可能性があります。ここでの問題は、モデルが何らかの理由で破損することではなく、モデルのトレーニングに使用されたデータが古くなり、将来の世界を反映しなくなることです。突然の大きなイベントがなくても、データドリフトが発生する可能性があります。モデルを評価し、運用環境で継続的に監視することが重要です。

Amazon SageMaker、Azure Machine Learning Studio、Google Cloud AutoML などのサービスには、モデルのパフォーマンスを評価するためのツールが含まれています。

5. ドメイン知識

ドメイン知識は特定の機械学習スキルではありませんが、成功する機械学習戦略にとって最も重要な要素の 1 つです。

各業界には独自の知識体系があるため、特にアルゴリズムによる意思決定ツールを構築する場合には、関連業界の調査が必要になります。機械学習モデルは、トレーニングに使用されるデータによって制限されます。ドメイン知識を持つ人は、AI をどこに適用するかを知り、その有効性を評価できます。

<<:  ディープラーニングのための 5 つのニューラル ネットワーク モデルとその応用

>>:  今後10年間で、AIは次の10の分野で世界に革命を起こすだろう

ブログ    

推薦する

...

日常生活における人工知能の12の例

以下の記事では、私たちの日常生活に登場する人工知能の12の例を確認することができます。人工知能 (A...

2020 年の予測: 今年はサイバー犯罪サービスが普及する年になるか?

業界メディアeWEEKの2020年の予測:人工知能と機械学習の「中毒」についての予測も見られ、これが...

インテルと4Paradigmが協力し、誰もがAIを利用できるように

[51CTO.com からのオリジナル記事] 今日、人工知能はもはや遠い概念ではなく、私たちの仕事と...

HanSight 万小川: 国内のセキュリティベンダーはセキュリティ人工知能を推進すべき

[51CTO.com より引用] RSA カンファレンスは、世界の IT セキュリティ動向のバロメー...

MetaのAIは、メタバースで「あなたの言葉を実現」することを可能にします

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

1996年生まれの美女が劉強東の豚顔認識選手権で優勝し、賞金30万元を獲得した。

[[213872]]レポーターハト先ほど、JDD-2017 JD Finance Global D...

市場レポートの予測: 2027年には世界の生体認証市場は1,000億ドルに近づく

近年、人工知能の継続的な成熟に伴い、生体認証技術は生活のあらゆる分野に浸透し、コストが削減され、効率...

...

...

組み込みアルゴリズム: ビッグデータ可変長ストレージアルゴリズム

1. 適用シナリオ高精度のサンプリング結果の場合、最大値には 3 バイト、最小値には 1 バイトが必...

科学者が人工結晶で大きな進歩を遂げ、コンピューターをより低電力で動作可能に

コンピューターは小型化、高性能化していますが、動作には大量のエネルギーが必要です。過去 10 年間で...

医療用ロボット:世界第2位のロボットの現状と今後の応用展望

医療用ロボットという用語は、監督なしで事前にプログラムされたタスクを自律的に実行する機械のイメージを...