AIの背後にあるエンジンを理解する、テクノロジー愛好家が知っておくべき4つの機械学習アルゴリズム

AIの背後にあるエンジンを理解する、テクノロジー愛好家が知っておくべき4つの機械学習アルゴリズム

人工知能は、車の運転、バーでのミキシング、戦争など、驚くべきことを行っていますが、ロボットマスクが脚光を浴び注目を集める一方で、真の技術愛好家であれば、驚くべき偉業を達成するロボットを動かし、制御する基本的な機械学習アルゴリズムを知っています。

最近の AI 開発でよく使用されている主な機械学習アルゴリズムは、決定木、ランダムフォレスト、サポートベクターマシン、ニューラルネットワークの 4 つです。 ロボット工学の背後にあるアルゴリズムは、機械学習の非物理的な応用は言うまでもなく、機械自体よりもさらに重要です。

機械学習の基礎

機械学習はいくつかの分野で構成されており、AI アプリケーションに最も関連しているのは教師あり学習です。 機械学習のこの部分では、アルゴリズムに x が与えられ、y を予測するように指示されます。 自動運転車のアプリケーションでは、x は現在の車の前にある画像である可能性があります。 画像のピクセルが幅 700 ピクセル、長さ 400 ピクセルで、x 寸法が 700 * 400 = 280,000 になると仮定します。

上記の例では、前方の道路の画像が長さ 280,000 のベクトルに変換され、トレーニング済みの機械学習モデルに入力されます。 この場合、モデルは「安全に走行できる」場合は 1 を出力します (道路が安全に走行できないと判断された場合は 0 を出力します)。 自動運転車の画像認識の他の分野には、奥行き知覚(物体までの距離の識別)や速度制限標識の読み取りなどがあります。 画像分類に加えて、機械学習の他の用途としては、人が道路を横断する速度を判定したり、前方の車が右折する可能性を判定したりすることなどがあります。

テキスト インスタンスでは、テキストはベクトル化されるか、数値配列に変換されます。 テキストは、たとえば実際のニュースとフェイクニュースに分類したり、生成(一意のテキストの作成)に使用したりできます。

機械学習アルゴリズムに出入りするすべてのものは純粋に数値であるため、すべてのアルゴリズムは本質的に数学的です。 機械学習アルゴリズムは、一連の数学的プロセスを実行して、多次元の x データを (通常は) 単一の y 値に変換するだけです。 教師あり学習の主なサブカテゴリは分類と回帰です。 前者は x を一連の個別のカテゴリに分類すること (例: 画像が猫か犬か) を目的としており、後者は xay を連続的なスケールで分布すること (例: 寝室の数などの属性に基づく住宅価格) を目的としています。

データの各次元は特徴とも呼ばれます。 画像の場合、各ピクセルが特徴であり、住宅価格を予測する例では、各住宅の属性(寝室の数、バスルームの数、水辺の有無など)が特徴になります。

決定木

決定木アルゴリズムは、一連の「はい/いいえ」の質問に従って最終的な結論に到達するという単純なアイデアに基づいています。 一例としては、友人に次にどんな食べ物を食べてみたいか尋ねることが挙げられます。 友達は、あなたがどの食べ物を試すべきかを判断するために、自分の経験に基づいて一連の「はい/いいえ」の質問をするかもしれません。 ツリーの例は次のようになります。

友達の質問に対するあなたの「はい」または「いいえ」の答えに基づいて、友達は木の下の道をたどってゴールまで行きます。 実際のデータ セットの場合、決定木は数十層の深さになることがあります。 決定木は分類に非常に強力です。 データセットでは、アルゴリズムは最も識別力の高い特徴を最上位に配置することでツリーを構築しようとします。 最も注目されている機能は、最も多くの情報を提供する最高の機能です。

特徴がどの程度「優れている」かは、その情報ゲイン、つまり、その特徴のみに基づいてデータを 2 つのクラスに分類することによって提供される情報の量によって測定できます。

意思決定ツリーのレイヤーでは、最上部に最も多くの情報取得機能が追加され、最下部に最も少ない情報取得機能が追加されます。 実際のデータセットでは、決定木は依然として「はい/いいえ」の質問を構築しますが、次のようにさまざまな方法で表現できます。

  • バスルームの数は3つ以上ですか?
  • 家は水辺の近くですか?

決定木アルゴリズムは、小規模な方法で回帰分析に使用することもでき、取得された情報の量に基づいて確率的な信頼性も提供します。 決定木は複雑なデータ構造を通じて方法を選択するために使用できますが、解釈も可能です。 決定木は、がん、アルツハイマー病、または関連する病状の診断に使用できます。 彼らは、人間の医師が決して達成できない複雑さと深さを捉えることができます。

ランダムフォレスト

ランダム フォレスト アルゴリズムを使用すると、決定木を改善できます。 決定木の問題は、情報の取得を最大化しようとするため、簡単に過剰適合してしまう可能性があることです。 この時点で、モデルはデータの分類が非常に得意になるため、新しいデータに使用するときに適切なパフォーマンスを発揮できなくなります。 これは、子供が特定の言い回しの質問に対する正確な答えを覚えているのに、異なる言い回しの質問には答えられないことに似ています。

機械学習では、決定木は非常に偏りのあるアルゴリズムであると考えられています。 友人が試してみるべき食べ物を勧めてくれるという例えと同じように、友人が 1 人だけだと偏った選択をしてしまう可能性があります。 ランダム フォレストは、複数の決定木モデルを「フォレスト」に含めることで、決定木アルゴリズムを拡張します。

友人が食べ物を勧めてくる例と同様に、10 人の友人に同じ「はい/いいえ」の質問回答プロセスを案内してもらうことを想像してください。 友達はそれぞれ好みや経験が異なるため、さまざまな質問をし、どの食べ物を試すべきかについて独自の結論を出します。 最後に、10 人の友人の大多数が注文すべきだと同意した食べ物を選択します。 これにより、1 人の友人だけではなく、多くの人々のグローバルな視点に基づいた、より総合的な決定が可能になります。

ランダム フォレスト アルゴリズムは、多数の決定木で構成されます。 それぞれはランダムに選択されたデータの異なるサブセットでトレーニングされます。 各モデルは、異なる経験や嗜好を持つのと同様に、データの異なるサブセットでトレーニングされます。 各サブセットに決定木を構築した後、ランダム フォレスト モデルは投票を集約して最終決定を下します。

ランダム フォレスト モデルは、決定木アルゴリズムが実行できるのと同じタスクを実行できます。 よりバランスのとれた視点を提供できるという利点がありますが、トレーニングには計算コストもかかります。 場合によっては、ランダム フォレストのパフォーマンスが決定木よりも悪くなることもあります。 いずれにせよ、決定木とランダムフォレストはどちらも AI で多くの用途を持つ非常に強力な分類アルゴリズムです。

サポートベクターマシン (SVM)

サポート ベクター マシン (SVM) アルゴリズムは、機械学習でバイナリ分類 (データ ポイントを 2 つのカテゴリのいずれかに分類する) に使用される一般的な強力なアルゴリズムです。 SVM アルゴリズムは、以下に示すように、データを 2 つのカテゴリに分類する線を構築します。

ただし、SVM の前提は、データが線形に分離可能であることです。つまり、データを直線 (または超平面) で 2 つの異なるクラスに配置できるということです。 ただし、常にそうであるとは限りません。

この場合、純粋に線形の SVM セパレータでは実際の曲線境界に対応できません。 したがって、スキンの問題に対処するために、SVM はさまざまなカーネル関数を適用して、線形に分離可能な境界間のデータを直線化します。 これは単純化されていますが、これがカーネル トリックの主なアイデアです。 たとえば、指数境界と、直線化に対数を適用することの影響について考えてみましょう。

また、最も簡単に線形分離できるデータを提供するために、多項式、シグモイド、ガウス、およびこれらの任意の組み合わせを含むがこれらに限定されない、データに適用する関数をトレーニングします。 高次元データでは、データの構造に関係なく SVM が適切に機能します。

サポート ベクター マシンは、パターンが認識しやすい低次元画像を分類するための計算コストの低い方法として使用されることがあり、そのためサポート ベクター マシンは画像を正しく分類できますが、複雑なデータ関係に一般的に使用されるアルゴリズム、つまりニューラル ネットワークの場合はそうではありません。

ニューラルネットワーク

ニューラル ネットワークは、機械学習における最も強力なアルゴリズム ファミリです。 しかし、すべてのデータセットで最適に機能する「普遍的な」アルゴリズムは存在しないことが数学的に証明されているため、ニューラル ネットワークをあらゆるデータセットに対する単純なソリューションとして使用すべきではありません。 さらに、トレーニングには費用がかかる可能性があるため、注意して使用する必要があります。

とはいえ、ニューラル ネットワークは最先端の AI アプリケーションで最も広く使用されているアルゴリズムです。 それらは脳内のニューロンとそれらの間の接続をシミュレートします。 ニューラル ネットワークには、次の 3 種類のレイヤーがあります。

  • 情報を受信するために使用される入力層。 入力層のニューロンの数は、入力の次元 (X) に対応します。 たとえば、画像データセットが 28 x 28 ピクセルの場合、入力層には 28 x 28 = 784 個のニューロンが含まれます。
  • 出力層はニューラル ネットワークの決定を出力します。 出力層のニューロンの数は、出力の次元 (y) に対応します。 たとえば、ニュースを本物 (1) か偽物 (0) かに分類するように設計されたデータセットには、出力ニューロンが 1 つだけあります。
  • 入力層と出力層を接続する隠し層。 隠し層により、ニューラル ネットワークの複雑さと情報がさらに増加し​​ます。 一般的に、隠し層の数が多いほど、ニューラル ネットワークが実行できる機能はより複雑で「インテリジェント」になります。

各ニューロンは小さな計算機のようなもので、情報は通過して変換され、次の層に渡されます。 ニューロンには、入力が通過する活性化関数があり、これは単に入力を、ニューラル ネットワークが情報をよりよく理解して処理するのに役立つ形式に変換します。

ニューロン間の各接続にも重みがあります。 情報が接続を通過すると、重みが乗算されます。

各ニューロンは小さな計算を実行し、それらが重みでリンクされると、現代のニューラル ネットワークは大規模な規模で動作します。数十の隠し層、層ごとに数百のニューロン、およびテキストの生成、画像の読み取り、およびその他の「インテリジェントな」操作の実行を可能にする数百万のパラメーター (重み) が動作します。

ニューラル ネットワークのバックプロパゲーション アルゴリズムは重みを調整します。 ニューラル ネットワークでは、ニューラル ネットワーク間の重みを調整します。 ネットワークが十分に大きい場合、数千万の重みのそれぞれをトレーニングするのに数時間、場合によっては数日かかることもあります。

ニューラルネットワークとディープラーニングは、AlphaGoが囲碁の世界チャンピオンに勝利したり、リアルなアートワークを作成したり、音楽を生成するなど、最近の技術開発の背後にあるアルゴリズムとなっています。

これで、AI のエンジンについて理解できました。

読んでいただきありがとうございます。AI や機械学習全般におけるこれら 4 つのアルゴリズムについてご質問やご不明な点がございましたら、お気軽にお問い合わせください。

<<:  ロボットが宇宙飛行士に取って代わるでしょうか?この会社は『アバター』を宇宙に送りたい

>>:  疫病流行中の人間の行動にAIが混乱!データ変更による作業の「異常」は手動での制御が必要

ブログ    

推薦する

...

...

GitHub トップ プロジェクト: 30 万語の図解アルゴリズム問題辞書、超実用的なリソース、6,000 個のスター

[[336071]]貴重なリソースをまとめましたので、ぜひご覧ください。アルゴリズムはコンピュータサ...

...

エッジコンピューティング時代の到来は AI にどのような影響を与えるのでしょうか?

[[270736]]近年、人工知能はテクノロジー界で注目されている分野です。中国では、Megvii...

AI専用SoCチップのIP要件の分析

[[386797]]この記事はWeChatの公開アカウント「Smart Computing Chip...

人工知能の利点をどう生かすか

企業で人工知能が応用され、開発されるにつれて、ビジネスリーダーは市場競争力を向上させるためにクラウド...

ロボティック プロセス オートメーションとスマート データ センターの未来

多くの人がロボットについて考えるとき、金属製のヒューマノイド、あるいはテレビ番組で互いに競い合うイン...

クローズドループへ! DriveMLM: LLM と自動運転行動計画の完璧な組み合わせ!

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

エージェントは迅速なエンジニアリングに使用されます

エージェントが現実世界での人間の行動を模倣する場合、それをプロンプトエンジニアリングに適用できますか...

人材獲得競争で大学に残ることを選んだAI研究者

[[265622]]ビッグデータダイジェスト制作著者: リン・アナン、周素雲AI 人材の需要が高まる...

すべては可能だ:コンピュータビジョンCVとNLPの分野はますます融合している

[[347900]] 2020年10月、ディープラーニング分野のトップカンファレンスであるICLR ...

EasyDL Professional Notebookモデリング機能の詳しい説明

Jupyter Notebook は、開発やドキュメントの作成からコードの実行、結果の表示まで、コン...

彼女に転送してください!文系女子でもわかるAIガイドライン

マッキンゼーのデータによれば、人工知能は今後10年間で米国に約13兆ドルの新たなGDPを生み出すだろ...

...