AIの背後にあるエンジンを理解する、テクノロジー愛好家が知っておくべき4つの機械学習アルゴリズム

人工知能は、車の運転、バーでのミキシング、戦争など、驚くべきことを行っていますが、ロボットマスクが脚光を浴び注目を集める一方で、真の技術愛好家であれば、驚くべき偉業を達成するロボットを動かし、制御する基本的な機械学習アルゴリズムを知っています。

最近の AI 開発でよく使用されている主な機械学習アルゴリズムは、決定木、ランダムフォレスト、サポートベクターマシン、ニューラルネットワークの 4 つです。ロボット工学の背後にあるアルゴリズムは、機械学習の非物理的な応用は言うまでもなく、機械自体よりもさらに重要です。

機械学習の基礎

機械学習はいくつかの分野で構成されており、AI アプリケーションに最も関連しているのは教師あり学習です。機械学習のこの部分では、アルゴリズムに x が与えられ、y を予測するように指示されます。自動運転車のアプリケーションでは、x は現在の車の前にある画像である可能性があります。画像のピクセルが幅 700 ピクセル、長さ 400 ピクセルで、x 寸法が 700 * 400 = 280,000 になると仮定します。

上記の例では、前方の道路の画像が長さ 280,000 のベクトルに変換され、トレーニング済みの機械学習モデルに入力されます。この場合、モデルは「安全に走行できる」場合は 1 を出力します (道路が安全に走行できないと判断された場合は 0 を出力します)。自動運転車の画像認識の他の分野には、奥行き知覚（物体までの距離の識別）や速度制限標識の読み取りなどがあります。画像分類に加えて、機械学習の他の用途としては、人が道路を横断する速度を判定したり、前方の車が右折する可能性を判定したりすることなどがあります。

テキストインスタンスでは、テキストはベクトル化されるか、数値配列に変換されます。テキストは、たとえば実際のニュースとフェイクニュースに分類したり、生成（一意のテキストの作成）に使用したりできます。

機械学習アルゴリズムに出入りするすべてのものは純粋に数値であるため、すべてのアルゴリズムは本質的に数学的です。機械学習アルゴリズムは、一連の数学的プロセスを実行して、多次元の x データを (通常は) 単一の y 値に変換するだけです。教師あり学習の主なサブカテゴリは分類と回帰です。前者は x を一連の個別のカテゴリに分類すること (例: 画像が猫か犬か) を目的としており、後者は xay を連続的なスケールで分布すること (例: 寝室の数などの属性に基づく住宅価格) を目的としています。

データの各次元は特徴とも呼ばれます。画像の場合、各ピクセルが特徴であり、住宅価格を予測する例では、各住宅の属性（寝室の数、バスルームの数、水辺の有無など）が特徴になります。

決定木

決定木アルゴリズムは、一連の「はい/いいえ」の質問に従って最終的な結論に到達するという単純なアイデアに基づいています。一例としては、友人に次にどんな食べ物を食べてみたいか尋ねることが挙げられます。友達は、あなたがどの食べ物を試すべきかを判断するために、自分の経験に基づいて一連の「はい/いいえ」の質問をするかもしれません。ツリーの例は次のようになります。

友達の質問に対するあなたの「はい」または「いいえ」の答えに基づいて、友達は木の下の道をたどってゴールまで行きます。実際のデータセットの場合、決定木は数十層の深さになることがあります。決定木は分類に非常に強力です。データセットでは、アルゴリズムは最も識別力の高い特徴を最上位に配置することでツリーを構築しようとします。最も注目されている機能は、最も多くの情報を提供する最高の機能です。

特徴がどの程度「優れている」かは、その情報ゲイン、つまり、その特徴のみに基づいてデータを 2 つのクラスに分類することによって提供される情報の量によって測定できます。

意思決定ツリーのレイヤーでは、最上部に最も多くの情報取得機能が追加され、最下部に最も少ない情報取得機能が追加されます。実際のデータセットでは、決定木は依然として「はい/いいえ」の質問を構築しますが、次のようにさまざまな方法で表現できます。

バスルームの数は3つ以上ですか?
家は水辺の近くですか？

決定木アルゴリズムは、小規模な方法で回帰分析に使用することもでき、取得された情報の量に基づいて確率的な信頼性も提供します。決定木は複雑なデータ構造を通じて方法を選択するために使用できますが、解釈も可能です。決定木は、がん、アルツハイマー病、または関連する病状の診断に使用できます。彼らは、人間の医師が決して達成できない複雑さと深さを捉えることができます。

ランダムフォレスト

ランダムフォレストアルゴリズムを使用すると、決定木を改善できます。決定木の問題は、情報の取得を最大化しようとするため、簡単に過剰適合してしまう可能性があることです。この時点で、モデルはデータの分類が非常に得意になるため、新しいデータに使用するときに適切なパフォーマンスを発揮できなくなります。これは、子供が特定の言い回しの質問に対する正確な答えを覚えているのに、異なる言い回しの質問には答えられないことに似ています。

機械学習では、決定木は非常に偏りのあるアルゴリズムであると考えられています。友人が試してみるべき食べ物を勧めてくれるという例えと同じように、友人が 1 人だけだと偏った選択をしてしまう可能性があります。ランダムフォレストは、複数の決定木モデルを「フォレスト」に含めることで、決定木アルゴリズムを拡張します。

友人が食べ物を勧めてくる例と同様に、10 人の友人に同じ「はい/いいえ」の質問回答プロセスを案内してもらうことを想像してください。友達はそれぞれ好みや経験が異なるため、さまざまな質問をし、どの食べ物を試すべきかについて独自の結論を出します。最後に、10 人の友人の大多数が注文すべきだと同意した食べ物を選択します。これにより、1 人の友人だけではなく、多くの人々のグローバルな視点に基づいた、より総合的な決定が可能になります。

ランダムフォレストアルゴリズムは、多数の決定木で構成されます。それぞれはランダムに選択されたデータの異なるサブセットでトレーニングされます。各モデルは、異なる経験や嗜好を持つのと同様に、データの異なるサブセットでトレーニングされます。各サブセットに決定木を構築した後、ランダムフォレストモデルは投票を集約して最終決定を下します。

ランダムフォレストモデルは、決定木アルゴリズムが実行できるのと同じタスクを実行できます。よりバランスのとれた視点を提供できるという利点がありますが、トレーニングには計算コストもかかります。場合によっては、ランダムフォレストのパフォーマンスが決定木よりも悪くなることもあります。いずれにせよ、決定木とランダムフォレストはどちらも AI で多くの用途を持つ非常に強力な分類アルゴリズムです。

サポートベクターマシン (SVM)

サポートベクターマシン (SVM) アルゴリズムは、機械学習でバイナリ分類 (データポイントを 2 つのカテゴリのいずれかに分類する) に使用される一般的な強力なアルゴリズムです。 SVM アルゴリズムは、以下に示すように、データを 2 つのカテゴリに分類する線を構築します。

ただし、SVM の前提は、データが線形に分離可能であることです。つまり、データを直線 (または超平面) で 2 つの異なるクラスに配置できるということです。ただし、常にそうであるとは限りません。

この場合、純粋に線形の SVM セパレータでは実際の曲線境界に対応できません。したがって、スキンの問題に対処するために、SVM はさまざまなカーネル関数を適用して、線形に分離可能な境界間のデータを直線化します。これは単純化されていますが、これがカーネルトリックの主なアイデアです。たとえば、指数境界と、直線化に対数を適用することの影響について考えてみましょう。

また、最も簡単に線形分離できるデータを提供するために、多項式、シグモイド、ガウス、およびこれらの任意の組み合わせを含むがこれらに限定されない、データに適用する関数をトレーニングします。高次元データでは、データの構造に関係なく SVM が適切に機能します。

サポートベクターマシンは、パターンが認識しやすい低次元画像を分類するための計算コストの低い方法として使用されることがあり、そのためサポートベクターマシンは画像を正しく分類できますが、複雑なデータ関係に一般的に使用されるアルゴリズム、つまりニューラルネットワークの場合はそうではありません。

ニューラルネットワーク

ニューラルネットワークは、機械学習における最も強力なアルゴリズムファミリです。しかし、すべてのデータセットで最適に機能する「普遍的な」アルゴリズムは存在しないことが数学的に証明されているため、ニューラルネットワークをあらゆるデータセットに対する単純なソリューションとして使用すべきではありません。さらに、トレーニングには費用がかかる可能性があるため、注意して使用する必要があります。

とはいえ、ニューラルネットワークは最先端の AI アプリケーションで最も広く使用されているアルゴリズムです。それらは脳内のニューロンとそれらの間の接続をシミュレートします。ニューラルネットワークには、次の 3 種類のレイヤーがあります。

情報を受信するために使用される入力層。入力層のニューロンの数は、入力の次元 (X) に対応します。たとえば、画像データセットが 28 x 28 ピクセルの場合、入力層には 28 x 28 = 784 個のニューロンが含まれます。
出力層はニューラルネットワークの決定を出力します。出力層のニューロンの数は、出力の次元 (y) に対応します。たとえば、ニュースを本物 (1) か偽物 (0) かに分類するように設計されたデータセットには、出力ニューロンが 1 つだけあります。
入力層と出力層を接続する隠し層。隠し層により、ニューラルネットワークの複雑さと情報がさらに増加します。一般的に、隠し層の数が多いほど、ニューラルネットワークが実行できる機能はより複雑で「インテリジェント」になります。

各ニューロンは小さな計算機のようなもので、情報は通過して変換され、次の層に渡されます。ニューロンには、入力が通過する活性化関数があり、これは単に入力を、ニューラルネットワークが情報をよりよく理解して処理するのに役立つ形式に変換します。

ニューロン間の各接続にも重みがあります。情報が接続を通過すると、重みが乗算されます。

各ニューロンは小さな計算を実行し、それらが重みでリンクされると、現代のニューラルネットワークは大規模な規模で動作します。数十の隠し層、層ごとに数百のニューロン、およびテキストの生成、画像の読み取り、およびその他の「インテリジェントな」操作の実行を可能にする数百万のパラメーター (重み) が動作します。

ニューラルネットワークのバックプロパゲーションアルゴリズムは重みを調整します。ニューラルネットワークでは、ニューラルネットワーク間の重みを調整します。ネットワークが十分に大きい場合、数千万の重みのそれぞれをトレーニングするのに数時間、場合によっては数日かかることもあります。

ニューラルネットワークとディープラーニングは、AlphaGoが囲碁の世界チャンピオンに勝利したり、リアルなアートワークを作成したり、音楽を生成するなど、最近の技術開発の背後にあるアルゴリズムとなっています。

これで、AI のエンジンについて理解できました。

読んでいただきありがとうございます。AI や機械学習全般におけるこれら 4 つのアルゴリズムについてご質問やご不明な点がございましたら、お気軽にお問い合わせください。

<<: ロボットが宇宙飛行士に取って代わるでしょうか？この会社は『アバター』を宇宙に送りたい

>>: 疫病流行中の人間の行動にAIが混乱！データ変更による作業の「異常」は手動での制御が必要

人間のフィードバックなしで調整します。田元東チームの新しい研究RLCD：無害で有益なアウトラインライティングはベースラインモデルを全面的に上回る

AIの背後にあるエンジンを理解する、テクノロジー愛好家が知っておくべき4つの機械学習アルゴリズム

人間のフィードバックなしで調整します。田元東チームの新しい研究RLCD：無害で有益なアウトラインライティングはベースラインモデルを全面的に上回る

速報です！ TensorFlow テクニカルディレクターの Pete Warden 氏は辞職し、博士号取得を目指してスタンフォード大学に戻りました。「Google では難しすぎた」からです。

3D モデルの「スキンを変更する」のはどれくらい簡単ですか?一言だけ

OpenAIのCLIPは「平易な言葉」を使った正確な画像検索で皆を驚かせた

マスク氏は有言実行だ！テスラブランドの人工呼吸器が「納品」、モデル3の部品で製造

AR は人工知能と見なされますか?この記事を読めば分かるだろう

データ時代の金採掘者になりましょう。Analysysアルゴリズムコンペティションがあなたの実力を披露するのを待っています。

GPT-3オープンソースのPutianバージョン：事前学習済みモデルGPT Neoと同等の再現

推薦する

サイバーセキュリティにおける AI に関する 3 つの誤解

Google: 人工知能、機械学習などを Wear OS オペレーティングシステムに統合

実践 | 人工知能が小売体験を向上させる 20 の例

ビル・ゲイツ氏：AIはリスクがあるが管理可能であり、PCの出現に匹敵する「最も変革的なイノベーション」である

DNAを使って画像を直接保存する「生きた細胞カメラ」は96ピクセルの解像度を持つ

アジャイル開発が機械学習に役立つ5つの方法

人工知能はメタバースのビジョンの実現に役立つでしょうか?

AIが不動産業務を簡素化する方法

自動機械学習でニューラルネットワークを進化させる方法

ニューヨーク・タイムズは、自社のニュース記事をAIモデルの訓練に利用することを禁止し、OpenAIを訴えることを検討している。

アリババには、1秒間に8人の弁護士を打ち負かした新しい技術者がいる