機械学習における「アルゴリズム」とは何ですか? 機械学習における「アルゴリズム」とは、データに対して実行され、機械学習「モデル」を作成するプロセスです。 機械学習アルゴリズムは「パターン認識」を実行します。アルゴリズムはデータから「学習」し、データセットを「適合」します。 機械学習アルゴリズムは数多く存在します。たとえば、K 最近傍アルゴリズムなどの分類アルゴリズム、線形回帰などの回帰アルゴリズム、K 平均法アルゴリズムなどのクラスタリング アルゴリズムがあります。 以下は機械学習アルゴリズムの例です。
機械学習アルゴリズムは、コンピューターサイエンスの他のアルゴリズムと同じように考えることができます。 たとえば、皆さんがよくご存知のその他の種類のアルゴリズムとしては、データの並べ替えに使用するバブル ソートや、検索に使用するベスト ファースト ソートなどがあります。 したがって、機械学習アルゴリズムには多くの特性があります。
たとえば、研究論文や教科書では、機械学習アルゴリズムが疑似コードや線形代数を使用して説明されていることがあります。特定の機械学習アルゴリズムの計算効率を別の特徴アルゴリズムと比較して確認できます。 学者はホログラフィック機械学習アルゴリズムを設計でき、機械学習の専門家はプロジェクトで標準的な機械学習アルゴリズムを使用できます。これはコンピューター サイエンスの他の分野と同様で、学者がまったく新しいソート アルゴリズムを設計し、プログラマーがアプリケーションで標準のソート アルゴリズムを使用することができます。 標準 API を備えたライブラリで複数の機械学習アルゴリズムの実装が提供されている場合もあります。よく使われる例としては、Python で多くの分類、回帰、クラスタリング機械学習アルゴリズムの実装を提供する scikit-learn ライブラリがあります。 機械学習における「モデル」とは何ですか? 機械学習における「モデル」とは、データに対して実行される機械学習アルゴリズムの出力です。 モデルは、機械学習アルゴリズムが学習した内容を表します。 モデルとは、トレーニング データに対して機械学習アルゴリズムを実行した後に保存される「もの」であり、予測を行うために必要なルール、数値、その他のアルゴリズム固有のデータ構造を表します。 これをより明確にするために、いくつか例を挙げてみましょう。
機械学習モデルは、コンピュータサイエンスの他のアルゴリズムとの明確な類似性がないため、初心者にとってより困難です。 たとえば、ソート アルゴリズムのソート済みリスト出力は、実際にはモデルではありません。 最も適切な類推は、機械学習モデルを「プログラム」として考えることです。 機械学習モデルの「プログラム」は、データと、そのデータを使用して予測を行うプロセスで構成されます。 たとえば、線形回帰アルゴリズムとその結果のモデルを考えてみましょう。モデルは、予測 (予測プロセス) を行うために、入力として新しいデータ行を乗算して合計する係数 (データ) のベクトルで構成されます。 後で使用するために、データを機械学習モデルとして保存します。 機械学習ライブラリによって提供される機械学習モデルの予測プロセスは、よく使用されます。場合によっては、予測プロセスをアプリケーションの一部として独自に実装できることもあります。ほとんどの予測手順は単純であるため、これは通常簡単です。 アルゴリズムとモデルフレームワーク これで、機械学習の「アルゴリズム」と機械学習の「モデル」について理解できました。 具体的には、データに対してアルゴリズムを実行してモデルを作成します。
また、モデルはデータと、そのデータを使用して新しいデータについて予測を行うプロセスで構成されていることも学びました。必要に応じて、このプロセスを予測アルゴリズムとして考えることもできます。
この区別は、さまざまなアルゴリズムを理解するのに非常に役立ちます。 たとえば、ほとんどのアルゴリズムでは、「アルゴリズム」にすべての作業が含まれており、「予測アルゴリズム」にはほとんど作業がありません。 通常、アルゴリズムとは、トレーニング データセット上のモデル (データ + 予測アルゴリズム) のエラーを最小限に抑える、ある種の最適化手順です。線形回帰アルゴリズムは良い例です。最適化手順を実行して(または線形代数を使用して解析的に解決して)、トレーニング データセットの二乗誤差の合計を最小化する重みのセットを探します。 線形回帰
一部のアルゴリズムは単純であるか、まったく何もせず、すべての作業はモデルまたは予測アルゴリズム内で行われます。 トレーニング データセット全体を保存する以外に、K-Nearest Neighbors アルゴリズムには他のアルゴリズムはありません。したがって、ウェイクアップ データはトレーニング データセット全体であり、すべての作業は予測アルゴリズム内にあります。つまり、新しいデータ行が保存されたトレーニング データセットとどのように相互作用して予測を行うかということです。 K近傍法
この分解をフレームワークとして使用して、あらゆる機械学習アルゴリズムを理解することができます。 機械学習は自動プログラミングである 私たちが本当に求めているのは機械学習の「モデル」であり、「アルゴリズム」はそのモデルを取得するための道筋です。 機械学習技術は、他の方法では効果的または効率的に解決できない問題を解決するために使用されます。 たとえば、電子メールをスパムかそうでないか分類する必要がある場合、このタスクを実行するためのソフトウェア プログラムが必要です。 私たちは座って、大量のメールを手作業で確認し、タスクを限定するための if ステートメントを書くことができました。人々はこのアプローチを試してきました。このアプローチは遅く、脆弱で、あまり効果的ではないことが証明されています。 代わりに、機械学習技術を使用してこの問題を解決することができます。具体的には、Naive Bayes などのアルゴリズムは、過去の電子メール サンプルの大規模なデータセットから電子メールをスパムと非スパムに分類する方法を学習できます。 私たちが求めているのは「ナイーブ ベイズ」ではなく、ナイーブ ベイズが提供するモデル、つまり電子メールを分類するために使用できるモデル (確率ベクトルと、その確率を使用する予測アルゴリズム) です。私たちが欲しいのはモデルであり、モデルを作成するために使用されるアルゴリズムではありません。 この意味で、機械学習モデルとは、問題を解決するために機械学習アルゴリズムによって自動的に記述、作成、または学習されるプログラムです。 開発者として、私たちは機械学習アルゴリズムが AI の意味でどのように「学習」するかにはあまり興味がありません。私たちは学習プロセスをシミュレートすることに関心はありません。気にする人もいるかもしれませんし、それは興味深いことですが、それが機械学習アルゴリズムを使用する理由ではありません。 むしろ、私たちは機械学習アルゴリズムによって提供される自動プログラミング機能に興味を持っています。実用的なモデルを効率的に作成し、それをソフトウェア プロジェクトに組み込むことができるようにしたいと考えています。 機械学習アルゴリズムは自動プログラミングを実行しますが、機械学習モデルは私たちのために作成されたプログラムです。 |
<<: Hacker News のホットな話題: 利用できるパッケージが非常に多いにもかかわらず、プログラマーは依然としてアルゴリズムを学ぶ必要があるのでしょうか?
>>: トレーニング速度が60%アップ!わずか5行のコードで、PyTorch 1.6は自動混合精度トレーニングをネイティブにサポートします。
翻訳者 | 陳俊レビュー | Chonglou現在、人工知能 (AI) アプリケーションの人気と急速...
Forrester は 2021 年の技術予測シリーズを発表しましたが、その中にはエッジ コンピュー...
Microsoft と OpenAI の提携は、現在テクノロジー界で最も注目されているものの 1 つ...
近年、教師あり学習によるディープラーニングも大きな成功を収めています。画像分類から言語翻訳まで、その...
「墜落」とは模型飛行機の用語です。簡単に言うと、模型飛行機が不適切な操作や機械の故障により異常に地...
この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...
人間がAIを見つめると、AIも人間を見つめる。大規模 AI モデルの大規模な応用と進化において、ネッ...
2023年10月11日、北京の黄金の秋に、第9回HAOMO AI DAYが予定通り開催されました。今...
偽造品、アルゴリズムの偏り、その他の問題が私たちの日常生活に及ぼす影響過去数年間、人工知能は私たちの...
人生におけるすべてのことは時間と関連しており、連続性を形成しています。シーケンシャルデータ(テキスト...
OpenAI は、人工知能 (AI) の作成と推進を専門とする非営利団体です。そのビジョンは、人間...
毎年恒例の国際コンシューマー・エレクトロニクス・ショー(CES)が始まったため、ラスベガス・ストリッ...
12月20日、ファーウェイクラウド開発者デーと2023イノベーションシェアリングサミットが成功裏に開...