概念とそれがビジネス目標に与える影響を学ぶことは非常に重要です。 アルゴリズムの選択 問題の定義を少し変更するだけで、その問題を解決するためにまったく異なるアルゴリズムが必要になるか、少なくとも異なるデータ入力を使用して異なるモデルを構築する必要がある場合があります。ユーザーの写真の種類を識別できる出会い系サイトでは、クラスタリングなどの教師なし学習手法を使用して共通のテーマを識別できます。一方、サイトが特定の人物にデートの相手を推薦したい場合、その人物がすでに見た写真など、その人に固有の入力データに基づく教師あり学習を使用する可能性があります。 特徴選択 機械学習モデルはデータ内のパターンを識別します。モデルに入力されるデータは、特徴 (変数または属性とも呼ばれます) に編成されます。これらは、予測または識別する現象の側面を説明する、関連性のある、ほとんどが独立したデータです。 先ほど述べた、ローン申請者へのアウトリーチを優先したいと考えていた会社の例を見てみましょう。問題を「コンバージョンの可能性に基づいて顧客に優先順位を付ける」と定義すると、会社のさまざまなアウトリーチ キャンペーンに対する同様の顧客の応答率を含む機能が得られます。問題を「ローンを返済する可能性が最も高い顧客を優先する」と定義すると、これらの特徴は顧客の可能性の評価に関連しないため、得られません。 目的関数の選択 目的関数は、最適化する目標、またはモデルが予測しようとしている結果です。たとえば、ユーザーが興味を持ちそうなアイテムを推奨する場合、モデルの出力は、ユーザーがそのアイテムを見たときにクリックする確率、またはユーザーがそのアイテムを購入する確率になる可能性があります。目的関数の選択は、主にビジネス目標によって異なります。この例では、ユーザー エンゲージメント (目的関数はクリック数または滞在時間) と収益 (目的関数は購入数) のどちらに関心がありますか? 考慮すべきもう 1 つの重要な要素は、データの可用性です。アルゴリズムが学習するには、ポジティブ (ユーザーが見てクリックした製品) またはネガティブ (ユーザーが見たがクリックしなかった製品) として「ラベル付け」された大量のデータ ポイントを提供する必要があります。 機械学習モデルを開発するには? 概要: 優れた機械学習モデルの作成は、他の製品の作成と同じです。まず、アイデア出しから始め、解決すべき問題と潜在的な解決策を考えます。明確な方向性が決まったら、ソリューションのプロトタイプを作成し、それがニーズを満たしているかどうかをテストすることができます。この記事では、その方法を段階的に見ていきましょう。 モデリング手順の概要 大まかに言えば、優れた機械学習モデルを作成することは、他の製品を構築することと同じです。つまり、アイデア創出、つまり解決すべき問題といくつかの潜在的な解決策を考えることから始まります。明確な方向性が決まったら、ソリューションのプロトタイプを作成し、それがニーズを満たしているかどうかをテストできます。ソリューションが市場に受け入れられるほど良くなるまで、アイデア創出、プロトタイピング、テストを繰り返す必要があります。その時点でソリューションを製品化し、リリースします。それでは、各段階を詳しく見ていきましょう。 データは機械学習の非常に重要な要素であるため、製品開発プロセスの上にデータを重ねる必要があります。そのため、プロセスは次のようになります。
概念 このフェーズの目標は、モデルが解決する主要な問題、目的関数、および潜在的な入力をモデル全体と一致させることです。
データ準備 このフェーズの目標は、生データを収集し、それをプロトタイプ モデルの入力として使用することです。生データを入力データとして使用できるようにするには、生データに対して複雑な変換を実行する必要がある場合があります。たとえば、あなたの特徴の 1 つが、消費者があなたのブランドについてどう思っているかだとします。まず、消費者があなたのブランドについて話している関連ソースを見つける必要があります。ブランド名に一般的な単語(「リンゴ」など)が含まれている場合は、プロトタイプを構築する前に、ブランド名をその一般的な意味(果物に関連)から区別し、感情分析モデルにかける必要があります。すべての機能の構築が複雑というわけではありませんが、一部の機能には多くの作業が必要になる場合があります。 このフェーズに含まれる内容を詳しく見てみましょう。
プロトタイプとテスト このフェーズの目標は、モデルのプロトタイプを取得し、それをテストし、本番環境で使用できるほど優れたモデルが得られるまで反復することです。
製品化 プロトタイプ モデルがビジネス上の問題を十分に解決し、実稼働に移行できるようになったときに、この段階に到達します。まだ完全な製品化の準備ができていない場合は、まずモデルをどの程度まで拡張するかを決定する必要があることに注意してください。たとえば、映画推薦ツールの場合、まず少数のユーザーに推薦サービスを提供して、各ユーザーに完全なユーザー エクスペリエンスを提供する必要があります。この場合、モデルは、各ユーザーとの関連性に応じてデータベース内の各映画をランク付けする必要があります。これは、単にアクション映画を推奨することとは異なる拡張機能の要件です。 それでは、モデルの製品化に関する技術的な詳細をいくつか見ていきましょう。
これまで説明してきたのは概念的なプロセスです。現実には、境界は曖昧であることが多く、異なる段階の間を行ったり来たりする必要があることがよくあります。データの供給に満足できず、最初からやり直すことを検討したり、モデルが製品化された後にモデルがうまく機能しないことがわかり、戻ってプロトタイプを再構築しなければならない場合もあります。 |
<<: 2030年にAIは人間のためにどんな仕事を創出できるでしょうか?
>>: タオバオの顔面を平手打ちして電子商取引を破壊しよう!このファッション会社はアルゴリズムを使って新しい小売業をリードしている
人工知能は、産業用ロボットやロボットプロセス自動化 (RPA) における新たなアプリケーションを推進...
10月31日午前、杭州雲棲鎮で2023年雲棲会議が開幕した。アリババグループのジョセフ・ツァイ会長は...
3年間「奇妙な病気」の治療を求めても効果がなかったのですが、ついにChatGPTによって診断に成功し...
ロボットは大学のキャンパスに食べ物を配達したり、ゴルフコースでホールインワンを達成したりすることがで...
今日、カスタマー サービス ロボットは私たちにとって馴染み深い存在です。電話料金、住所、登録、ビジネ...
米国の科学者チームは、人工知能を利用して非常に短期間で新たな鉄鋼の代替品を発見したいと考えている。そ...
生体認証技術といえば、アメリカの Clearview AI 社を挙げなければなりません。同社は最も包...
IT は、世界で最も人気のあるスポーツであるサッカーをスペインで発展させ、体験する上で重要な役割を果...
[[387017]] 01 まさに必要: ビッグデータ天体物理学の時代が到来観測技術の発展により、...
[[379872]] 【はじめに】「遠く離れた親友は遠い国を近づける」これは、Shi Tou兄弟が私...
みなさんこんにちは、私はZhibinです〜今日は、GridSearch グリッド検索と K 分割相互...