機械学習とは何ですか?機械はどんどん賢くなっていて、もはやSFの世界ではない

機械学習とは何ですか?機械はどんどん賢くなっていて、もはやSFの世界ではない

[[351468]]

機械学習 (ML) は、一連のデータに基づいて予測を行うようにコンピューター システムを学習させるプロセスです。機械学習の研究者は、一連の試行錯誤のシナリオをシステムに入力することで、データを分析し、質問に答え、自ら意思決定を行うことができる AI システムの作成に取り組んでいます。

機械学習では通常、将来の意思決定における推論とパターン認識に役立つテスト データに基づくアルゴリズムが使用されるため、従来のコンピューター ソフトウェアで必要となる人間からの明示的な指示が不要になります。

機械学習とは何ですか?

機械学習は、アルゴリズムに入力される大量のデータに依存し、システムが将来の決定を予測できるモデルを生成します。たとえば、システムに入力するデータが 1 年間毎日昼食に食べる果物である場合、予測アルゴリズムを使用してさまざまな果物を分析し、翌年に食べる可能性のある果物の予測モデルを構築できます。

このプロセスは試行錯誤に基づいており、多くの場合、さまざまなアルゴリズムが使用されます。これらのアルゴリズムは、線形モデル、非線形モデル、さらにはニューラル ネットワークに分類されます。最終的には、作業しているデータセットと回答しようとしている質問によって異なります。

機械学習アルゴリズムはどのように機能するのでしょうか?

機械学習アルゴリズムは、データを使用して時間の経過とともに学習および改善するため、人間の指導は必要ありません。アルゴリズムは、教師あり学習、教師なし学習、強化学習の 3 つのタイプに分類されます。学習の種類ごとに目的が異なり、データの使用方法も異なります。

教師あり学習

教師あり学習には、アルゴリズムが入力変数を出力変数に変換して方程式を解くマッピング関数を学習するために使用するラベル付けされたトレーニング データが含まれます。教師あり学習には 2 つのタイプがあります。出力がカテゴリ形式の場合の分類は、特定のサンプルの結果を予測するために使用されます。出力がカテゴリ形式の場合の回帰は、特定のサンプルの結果を予測するために使用されます。変数は「給与」や「体重」などの実際の値です。

教師あり学習モデルの例としては、パターン認識手法である K 近傍法 (KNN) アルゴリズムがあります。 KNN は基本的に、グラフを使用して、近くにある類似のオブジェクトの分布に基づいてオブジェクトの分類について推測を行います。

上記の表では、緑色の円は、青い四角形または赤い三角形の 2 つのカテゴリのいずれかにのみ属することができる未分類のオブジェクトを表します。この場合、どのカテゴリに属する​​かを識別するために、アルゴリズムはグラフ上の最も近いオブジェクトを分析し、緑色の円は赤い三角形のカテゴリに属する​​と合理的に想定します。

教師なし学習

教師なし学習モデルは、入力変数のみがあり、対応する出力変数がない場合に使用されます。ラベルのないトレーニング データを使用して、データの基礎となる構造をモデル化します。

教師なし学習アルゴリズムには、市場ショッピング分析で広く使用されている関連付け、別のクラスター内のオブジェクトに類似するサンプルを一致させるために使用されるクラスタリング、および重要な情報をそのまま維持しながらデータセット内の変数の数を減らすために使用される次元削減の 3 つのタイプがあります。

強化学習

強化学習により、エージェントは報酬を最大化する行動を学習し、現在の状態に基づいて次のアクションを決定できるようになります。これはゲームのコンテキストでよく使用され、アルゴリズムがルールを提供し、最も効率的な方法で課題を解決する役割を果たします。モデルは最初はランダムに開始しますが、時間の経過とともに試行錯誤し、スコアを最大化するためにゲーム内でどこにいつ移動する必要があるかを学習します。

このタイプのトレーニングでは、報酬は単に肯定的な結果に関連付けられたステータスです。たとえば、アルゴリズムが障害物にぶつかることなく車を道路上に維持することができれば、ミッション達成として「報酬」が与えられます。

[[351469]]

機械学習はなぜ役立つのでしょうか?

本質的に、機械学習はデータが多すぎるという問題を解決します。人、行動、出来事、コンピューター、ガジェットによって生成される情報は膨大で、人間がそこから何かを学ぶことはほぼ不可能です。医療分析では、何千もの MRI スキャンからパターンを見つけるのに人間が数時間、数日、または数週間かかる場合がありますが、機械は、正しくラベル付けされていれば、その情報を吸収して数秒でそれらのパターンを見つけることができます。

機械学習はどこで使用されていますか?

機械学習の最もシンプルで成功した例の 1 つは、私たちが毎日使用しているもの、つまり Google 検索です。検索エンジンは、入力したテキストを読み取って分析し、検索履歴やオンライン習慣に基づいて結果をカスタマイズする多数の ML アルゴリズムを搭載しています。たとえば、「Java」と入力すると、好みに応じて、プログラミング言語を中心とした結果が表示されたり、より頻繁に表示されたりします。

自動運転車やスマートシティなど、将来の技術の進歩の多くは機械学習の進歩に依存しています。スマートシティを支えるシステムの多くは、顔認識システムなど公共の場にも導入されつつあります。顔認識システムでは、機械学習アルゴリズムが画像内のパターンを認識し、その特徴に基づいて物体を識別するように学習されます。しかし、これは必ずしも正確ではないことや、国民に対する何らかの定期的な監視を伴うことが多いことから、ML の物議を醸す使用法であることが判明しています。

データの偏り

機械学習が進歩し、より多くの技術が使用されるようになるにつれて、重要な一般向けソフトウェアに偏見が組み込まれることへの懸念が高まっています。機械学習アプリケーションはデータに依存しており、このデータがバイアスの原因となる可能性があります。たとえば、企業がより多様な人材を採用したいのに、現在の従業員の履歴書を使用する場合、その機械学習プログラムは、デフォルトで同じ人材をさらに探すことになります。

政府の間で懸念を引き起こしているのは、このタイプの機械学習アプリケーションであり、その結果、多くの政府がこの問題に対処するために強制的な規制を導入しています。英国データ倫理・イノベーションセンター(CDEI)は、アルゴリズムによる意思決定における潜在的な偏見を調査するため、内閣府の人種格差ユニットと協力すると発表した。同様に、米国政府は、コンピューター システムにおける性別や人種による偏見のリスクを軽減するために、AI における多様性規制を試験的に導入する予定です。

<<:  ブロックチェーンのいくつかのコンセンサスアルゴリズム

>>:  機械学習と古典的なアルゴリズムの概念をわかりやすい言葉で説明しました。初心者必読

ブログ    
ブログ    

推薦する

OpenAI: LLMはテストを受けていることを感知し、合格するために情報を隠して人間を騙す | 対策も添付

AIはここまでの発展を経て意識を獲得したのでしょうか?数日前、チューリング賞受賞者のベンジオ氏が参加...

SOA におけるソフトウェア アーキテクチャ設計とソフトウェアとハ​​ードウェアの分離方法論

次世代の集中型電子電気アーキテクチャでは、中央+ゾーン中央コンピューティング ユニットと地域コントロ...

Baidu Create 2019 Baidu AI 開発者カンファレンス Li Yanhong の素晴らしい名言

7月3日に開催されたBaidu Create 2019 Baidu AI Developer Con...

2017年世界ロボット会議エクスプレス:無人スーパーマーケットロボットがデビュー

[51CTO.com 北京レポート] 2017年8月23日から27日まで、2017年世界ロボット大会...

表形式データでの機械学習に特徴抽出を使用する方法

データ準備の最も一般的なアプローチは、データセットを調査し、機械学習アルゴリズムの期待値を確認し、最...

エイリアンがトレンド検索リストのトップに!米国が初のUFO公聴会を開催

昨日、米国議会の公聴会が中国国内の複数のメディアのトレンド検索のトップに躍り出た。 これを一言でまと...

会話型AIが重要なサービスに与える影響

コミュニケーションツールが進化するにつれ、電話や携帯電話は人々が情報を素早く共有する能力に大きな影響...

...

人工知能でカスタマーサービスエージェントを強化する方法

今日、ほぼすべての分野やビジネスが何らかの変革を遂げており、多くの企業がデジタル技術の波の推進力を受...

...

AI、自動化、そして仕事の未来: 取り組むべき10の課題

[[236355]]職場で機械が人間の労働に取って代わるにつれ、その恩恵を受けるためには私たち全員が...

...

近い将来、人工知能によって劇的に変化する11の業界

人工知能(AI)は急速に、そしてシームレスに生活の一部となったため、私たちの多くは、それが社会にどれ...