お父さん、機械学習って何ですか? 答えるのは難しい!髪の毛が抜け始めた頭を掻いた後でも、お父さんはこの質問にまだ負けていました。お子さんに対して、このやや学術的な質問にはどのように答えますか? 最近、コンピュータサイエンスの博士号を持つダニエル・トゥンケラン氏がQuoraで次のような質問に答えました。 機械学習の分類問題から始めて、どの食べ物が美味しくて、どの食べ物がまずいかをコンピューターに学習させるのはいかがでしょうか。
人間とは異なり、コンピューターには口がなく、食べ物を味わうことができません。したがって、多くの食品の例(ラベル付けされたトレーニング データ)を使用してコンピューターに学習させる必要があります。この項目の例には、おいしい食べ物(肯定的な例)とまずい食べ物(否定的な例)が含まれます。ラベル付けされた例ごとに、コンピューターに食品の説明(特徴)を与えました。 肯定的な例には、チョコレートアイスクリーム、ピザ、イチゴなどの「おいしい」というラベルが付けられます。アンチョビ、ブロッコリー、芽キャベツなどの悪い例には「不快」というラベルが付けられます。 実際の機械学習システムでは、おそらくさらに多くのトレーニング データが必要になりますが、概念を理解するには 3 つの肯定的な例と 3 つの否定的な例で十分です。
ここで、いくつかの機能が必要です。これらのサンプルを、甘い、塩辛い、野菜の 3 つの特徴に設定してみましょう。これらはバイナリ特徴なので、各食品の各特徴には「はい」または「いいえ」の値が割り当てられます。 これらのトレーニング データを使用して、コンピューターの役割は、これらのデータから数式 (モデル) を要約することです。そうすれば、新しい食べ物に遭遇したときに、そのモデルに基づいてその食べ物がおいしいかまずいかを判断できるようになります。 1 つのモデルはポイント システム (線形モデル) です。それぞれの特性を持っている場合は一定のスコア(重み)が得られ、持っていない場合はスコアが得られません。次に、モデルは食品のポイントを合計して最終スコアを算出します。 モデルにはカットオフポイントがあります。スコアがカットオフポイントよりも高い場合、モデルは食べ物がおいしいと判断し、スコアがカットオフポイントよりも低い場合、それは美味しくないと判断されます。 トレーニング データに基づいて、モデルの特徴スコアは、甘い場合は 3、塩辛い場合は 1、カリカリの場合は 1、野菜の場合は -1 に設定される可能性があります。モデルにおけるチョコレートアイスクリーム、ピザ、イチゴ、アンチョビ、カリフラワー、芽キャベツのスコアは次のとおりです。 重み付けにより、肯定的な例のスコアはすべて 2 以上、否定的な例のスコアは 1 以下になるため、カットオフ ポイントの選択が容易になります。 常に適切な重みとカットオフポイントを見つけるのは簡単ではありません。たとえ見つかったとしても、このトレーニング データにのみ機能するモデルになり、新しい例を使用するとモデルがうまく機能しなくなる可能性があります (過剰適合)。 理想的なモデルは、トレーニング データ内で正確であるだけでなく、新しい例でも効果的です (一般化)。一般的に、単純なモデルは複雑なモデルよりも一般化が容易です (オッカムの剃刀)。 線形モデルを使用する必要はなく、決定木を構築するのも良いアイデアです。意思決定ツリーでは、「はい」または「いいえ」で答えられる質問のみを行うことができます。 トレーニング データを使用して決定木に正しい答えを出させることは難しくありません。 この例では、トレーニング データは次のように使用されます。
線形モデルと同様に、過剰適合を心配し、決定木を深くしすぎないようにする必要があります。つまり、これは、トレーニング データでは間違いを犯しても、新しいデータに対してはより適切に一般化されるモデルが最終的に作成される可能性があることを意味します。 子どもたちに機械学習の説明が理解できるといいな〜 |
<<: デジタル経済は新たな時代へ:インターネットが主導権を握り、ビッグデータと人工知能が注目の的
>>: 金融分野で一般的に使用されているディープラーニングモデルのインベントリ
夏がまたやって来て、雷雨がまた虫を追い払います。最近では、夏の気温が上昇し続けているため、雨天が多く...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
米国現地時間7月6日水曜日、人工知能の新興企業OpenAIは、「超知能」人工知能システムを誘導・制御...
昨日、ソラがまた新たな「傑作」をリリースしました! 『SORA』の著者2人、ビル・ピーブルズとティム...
[[286435]]カメラはどこにでもあり、顔認識は生活のほぼあらゆる場面で使用されています。どのよ...
IT Homeは11月2日、LinkedInがユーザーの就職活動コーチとなり、次の仕事を見つける手助...
[[281019]]この記事はLeiphone.comから転載したものです。転載する場合は、Lei...
11月19日、北京で「百度銀行&百度クラウドAI+銀行金融技術シンクタンク」が開催されました。カンフ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[419321]]導入私は機械学習についてはよく知りませんが、先月、GitHub で Go のサン...
音声アシスタントからチャットボットまで、人工知能 (AI) はテクノロジーとのやり取りの方法に革命を...
近年、消費者向けインターネットが深化し、産業向けインターネットが徐々に向上するにつれて、さまざまな業...
TensorFlow2.0の正式版がリリースされてからしばらく経ちますが、それに関連する体系的なチュ...
2020 年には人工知能 (AI) が飛躍的に進歩し、機械学習はこのテクノロジーの最も成功し、広く普...