機械学習とは何ですか?機械はどんどん賢くなっていて、もはやSFの世界ではない

[[351468]]

機械学習 (ML) は、一連のデータに基づいて予測を行うようにコンピューターシステムを学習させるプロセスです。機械学習の研究者は、一連の試行錯誤のシナリオをシステムに入力することで、データを分析し、質問に答え、自ら意思決定を行うことができる AI システムの作成に取り組んでいます。

機械学習では通常、将来の意思決定における推論とパターン認識に役立つテストデータに基づくアルゴリズムが使用されるため、従来のコンピューターソフトウェアで必要となる人間からの明示的な指示が不要になります。

機械学習とは何ですか?

機械学習は、アルゴリズムに入力される大量のデータに依存し、システムが将来の決定を予測できるモデルを生成します。たとえば、システムに入力するデータが 1 年間毎日昼食に食べる果物である場合、予測アルゴリズムを使用してさまざまな果物を分析し、翌年に食べる可能性のある果物の予測モデルを構築できます。

このプロセスは試行錯誤に基づいており、多くの場合、さまざまなアルゴリズムが使用されます。これらのアルゴリズムは、線形モデル、非線形モデル、さらにはニューラルネットワークに分類されます。最終的には、作業しているデータセットと回答しようとしている質問によって異なります。

機械学習アルゴリズムはどのように機能するのでしょうか?

機械学習アルゴリズムは、データを使用して時間の経過とともに学習および改善するため、人間の指導は必要ありません。アルゴリズムは、教師あり学習、教師なし学習、強化学習の 3 つのタイプに分類されます。学習の種類ごとに目的が異なり、データの使用方法も異なります。

教師あり学習

教師あり学習には、アルゴリズムが入力変数を出力変数に変換して方程式を解くマッピング関数を学習するために使用するラベル付けされたトレーニングデータが含まれます。教師あり学習には 2 つのタイプがあります。出力がカテゴリ形式の場合の分類は、特定のサンプルの結果を予測するために使用されます。出力がカテゴリ形式の場合の回帰は、特定のサンプルの結果を予測するために使用されます。変数は「給与」や「体重」などの実際の値です。

教師あり学習モデルの例としては、パターン認識手法である K 近傍法 (KNN) アルゴリズムがあります。 KNN は基本的に、グラフを使用して、近くにある類似のオブジェクトの分布に基づいてオブジェクトの分類について推測を行います。

上記の表では、緑色の円は、青い四角形または赤い三角形の 2 つのカテゴリのいずれかにのみ属することができる未分類のオブジェクトを表します。この場合、どのカテゴリに属するかを識別するために、アルゴリズムはグラフ上の最も近いオブジェクトを分析し、緑色の円は赤い三角形のカテゴリに属すると合理的に想定します。

教師なし学習

教師なし学習モデルは、入力変数のみがあり、対応する出力変数がない場合に使用されます。ラベルのないトレーニングデータを使用して、データの基礎となる構造をモデル化します。

教師なし学習アルゴリズムには、市場ショッピング分析で広く使用されている関連付け、別のクラスター内のオブジェクトに類似するサンプルを一致させるために使用されるクラスタリング、および重要な情報をそのまま維持しながらデータセット内の変数の数を減らすために使用される次元削減の 3 つのタイプがあります。

強化学習

強化学習により、エージェントは報酬を最大化する行動を学習し、現在の状態に基づいて次のアクションを決定できるようになります。これはゲームのコンテキストでよく使用され、アルゴリズムがルールを提供し、最も効率的な方法で課題を解決する役割を果たします。モデルは最初はランダムに開始しますが、時間の経過とともに試行錯誤し、スコアを最大化するためにゲーム内でどこにいつ移動する必要があるかを学習します。

このタイプのトレーニングでは、報酬は単に肯定的な結果に関連付けられたステータスです。たとえば、アルゴリズムが障害物にぶつかることなく車を道路上に維持することができれば、ミッション達成として「報酬」が与えられます。

[[351469]]

機械学習はなぜ役立つのでしょうか?

本質的に、機械学習はデータが多すぎるという問題を解決します。人、行動、出来事、コンピューター、ガジェットによって生成される情報は膨大で、人間がそこから何かを学ぶことはほぼ不可能です。医療分析では、何千もの MRI スキャンからパターンを見つけるのに人間が数時間、数日、または数週間かかる場合がありますが、機械は、正しくラベル付けされていれば、その情報を吸収して数秒でそれらのパターンを見つけることができます。

機械学習はどこで使用されていますか?

機械学習の最もシンプルで成功した例の 1 つは、私たちが毎日使用しているもの、つまり Google 検索です。検索エンジンは、入力したテキストを読み取って分析し、検索履歴やオンライン習慣に基づいて結果をカスタマイズする多数の ML アルゴリズムを搭載しています。たとえば、「Java」と入力すると、好みに応じて、プログラミング言語を中心とした結果が表示されたり、より頻繁に表示されたりします。

自動運転車やスマートシティなど、将来の技術の進歩の多くは機械学習の進歩に依存しています。スマートシティを支えるシステムの多くは、顔認識システムなど公共の場にも導入されつつあります。顔認識システムでは、機械学習アルゴリズムが画像内のパターンを認識し、その特徴に基づいて物体を識別するように学習されます。しかし、これは必ずしも正確ではないことや、国民に対する何らかの定期的な監視を伴うことが多いことから、ML の物議を醸す使用法であることが判明しています。

データの偏り

機械学習が進歩し、より多くの技術が使用されるようになるにつれて、重要な一般向けソフトウェアに偏見が組み込まれることへの懸念が高まっています。機械学習アプリケーションはデータに依存しており、このデータがバイアスの原因となる可能性があります。たとえば、企業がより多様な人材を採用したいのに、現在の従業員の履歴書を使用する場合、その機械学習プログラムは、デフォルトで同じ人材をさらに探すことになります。

政府の間で懸念を引き起こしているのは、このタイプの機械学習アプリケーションであり、その結果、多くの政府がこの問題に対処するために強制的な規制を導入しています。英国データ倫理・イノベーションセンター（CDEI）は、アルゴリズムによる意思決定における潜在的な偏見を調査するため、内閣府の人種格差ユニットと協力すると発表した。同様に、米国政府は、コンピューターシステムにおける性別や人種による偏見のリスクを軽減するために、AI における多様性規制を試験的に導入する予定です。

<<: ブロックチェーンのいくつかのコンセンサスアルゴリズム

>>: 機械学習と古典的なアルゴリズムの概念をわかりやすい言葉で説明しました。初心者必読