中学校の知識を使って機械学習が何をしているのかを理解する方法

中学校の知識を使って機械学習が何をしているのかを理解する方法

[[333000]]

序文

Baidu 百科事典で「機械学習」を検索すると、私が決して到達できないレベルの達成度が見つかりました。

  • 機械学習は、確率論、統計、近似理論、凸解析、アルゴリズム複雑性理論など、多くの分野が関わる多分野にわたる学際的な科目です。コンピュータが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、既存の知識構造を再編成してパフォーマンスを継続的に向上させる方法を研究することに特化しています。

自分の IQ を疑っていたとき、私はこうも思っていました。機械学習は素晴らしいもので、人間の学習行動をシミュレートできると説明しているのに、この文章ではこの 4 つの単語の意味が理解できなかったようです。むしろ、精神的な負担が増えました。どんどん重くなる頭で読み進めていくと、このエントリで最も重要な定義と思われるものを見つけました。

でもそれは問題じゃない!!!

まるで『微笑む誇り高き放浪者』の「ひまわりマニュアル」を見ているようだ。去勢していないので、いくら高度な剣術を駆使しても一方的で、ただただすごいだけなのだ。この時点で、間違った方法で開けていたためであり、最初から間違っていた(自分自身を去勢しなければならなかった)ことがようやくわかりました。

そこで、やり方を変えて、今回は中学校の数学を使って開きます。

まずは線形関数から始めましょう

中学校の数学では、次のような問題によく遭遇します。

  • 平面上の 3 つの点の座標 (x, y) A(1,3)、B(2,5)、C(3,7) が与えられている場合、x=5 のときの y の値を求めます。

このような問題に直面した場合、まず図に示すように、3 つの点を座標軸上に配置して確認することができます。

3 つの点は直線上にあり、線形関数の特性に一致していることがわかります。次に、この直線の方程式を見つけ、方程式に x=5 を代入するだけで、この時点での y の値がわかります。

この時点で、疑問は次のようになります。

  • 3つの点A(1,3)、B(2,5)、C(3,7)が与えられた場合、水平座標と垂直座標の関係は線形関数に従います。

x=5 のときの y の値を求めます。

この時点で、問題は中学校レベルの知識になっています。3 つの点 A、B、C を y=kx+b に代入して k と b に関する連立方程式を作成し、それを解くと次のようになります。

そして、x=5 のとき、y は 2*5+1=11 になります (私に任せてください、計算できます)。

考えるべき質問

機械学習は、上記に似たプロセスに過ぎません。一定量の入力データ(x)と出力データ(y)が与えられたら、これらのxとyの関係を表す関数を見つけます。この関数に基づいて、xがわかっている条件下でyを簡単に計算できます。たとえば、オンラインで買い物をした後にコメントを入力すると、システムが自動的にそれが良いレビューか悪いレビューかを識別できます。

上記の場合の関数をモデル、x を特徴、y を機械学習で予測する結果、x と y の既知の組み合わせをトレーニング データと呼びます。トレーニング プロセスは、x と y の関係を見つけるプロセスです (ホイップするプロセスではありません)。

しかし、実際の機械学習のケースはそれほど単純ではないことがよくあります。 1 つの機能 x のみを持つ関数が、より複雑なビジネス ニーズをどのように満たすことができるのでしょうか。

「1つがダメなら、2つ。2つがダメなら、3つ。3つがダメなら、さらに追加できます。料金を支払うだけです。話がそれてすみません!」

複数の特徴がある場合でも、上記の線形関数の基礎に基づいてモデルの仮定を立てることができる。

これで問題は解決できます。これは機械学習におけるより基本的な線形回帰です。

これらの関数は値を計算するだけで意味がないと思われる場合は、どのコメントが適切で、どのコメントが適切でないかを識別するのを手伝ってもらえますか?

「もちろん問題ありません! y の結果を 0 から 1 の間にマッピングし、y を判断するだけです。y>=0.5 は良いレビューを意味し、y<0.5 は悪いレビューを意味します。このマッピング関数を活性化関数と呼びます。理解できれば、どのように実装するかは気にしません。」

これは、機械学習における分類タスクのロジスティック回帰を実装します。

1 つの特徴が 1 つの重みに対応し、その重みが少し低く、多くのものが線形関係にないと考えられる場合、この問題をどのように解決すればよいでしょうか?

「1 層の重量が足りない場合は、さらに追加します。それでも足りない場合は、さらに追加します。」


もっと欲しい?もう少し追加します

上記のプロセスはちょっと行き過ぎて、偶然にディープラーニングのレベルに到達しました。道のりは長くて困難で、私のIQは少し遅れています...(そのため、代わりに省略記号を使用します)

要約する

上記のケースは機械学習における教師あり学習のプロセスにすぎません。実際の機械学習はこれよりもはるかに複雑な場合が多いです。また、教師なし学習と半教師あり学習に分けられます。ここでは詳細には触れません。機会があれば書きます。ではまた!

<<:  機械学習は簡単になっていますが、ソフトウェア エンジニアリングは逆の方向に進んでいます...

>>:  DAMOアカデミーの医療AIは、整形外科手術における歴史的課題を解決し、解剖学的位置を0.3秒で特定します。

ブログ    
ブログ    
ブログ    

推薦する

顔認識は常に私たちのそばにあり、中秋節は「ハッピースキャン」から始まります

[[424699]]中秋節が近づいており、旅行の計画を立てている方も多いと思います。この特別な期間中...

2021年、人工知能は再び疫病との戦いで役割を果たすだろう

[[344407]] COVID-19パンデミックが世界を席巻する以前から、人工知能(AI)、特にそ...

データ駆動型パーソナライゼーションの時代: AI と ML がデータの読み取りと理解の方法をどのように変えているのか

今日のビジネスはデータとデータに基づく理解によって支配されています。データをどのように理解し、それを...

爆発的なソラの背後にある技術、拡散モデルの最新の開発をレビューする記事

機械が人間の想像力を持てるようにするために、深層生成モデルは大きな進歩を遂げました。これらのモデルは...

AIアラインメントを説明する4万語:北京大学と複数の大学チームがアラインメントの包括的なレビューを発表

論文(継続的に更新):arxiv.org/abs/2310.19852 AI アライメント概要ウェブ...

AIを活用してデジタル変革プロジェクトを改善する9つの方法

AI と ML テクノロジーが人気の話題になると、デジタル トランスフォーメーションの定義とビジネス...

ChatGPTがやってくる、個人はそれにどう対処すべきか

このテーマについて、人工知能の起源と発展、その一般原理、不安を避ける方法、そして時代に追いつく方法な...

第6回ドルイドチャイナミートアップがKuaishou本部で開催されました

3月16日、KuaishouとTestin Cloud Testingが共同で主催するApache ...

無人タクシーが登場します。準備はできていますか?

[[243616]]地図: 小魚クラウド コンピューティングやビッグ データなどのアプリケーション...

...

...

...

CLIP と LLM を使用したマルチモーダル RAG システムの構築

この記事では、オープンソースの Large Language Multi-Modal モデルを使用し...

ChatGPT がリリースされてから 1 年が経ちました。主要なオープン ソース モデルはすべて追いついたのでしょうか?

1年前の今日、ChatGPTが誕生し、人工知能の新しい時代が到来したように思えました。 ChatG...

...