中学校の知識を使って機械学習が何をしているのかを理解する方法

中学校の知識を使って機械学習が何をしているのかを理解する方法

[[333000]]

序文

Baidu 百科事典で「機械学習」を検索すると、私が決して到達できないレベルの達成度が見つかりました。

  • 機械学習は、確率論、統計、近似理論、凸解析、アルゴリズム複雑性理論など、多くの分野が関わる多分野にわたる学際的な科目です。コンピュータが人間の学習行動をシミュレートまたは実装して新しい知識やスキルを獲得し、既存の知識構造を再編成してパフォーマンスを継続的に向上させる方法を研究することに特化しています。

自分の IQ を疑っていたとき、私はこうも思っていました。機械学習は素晴らしいもので、人間の学習行動をシミュレートできると説明しているのに、この文章ではこの 4 つの単語の意味が理解できなかったようです。むしろ、精神的な負担が増えました。どんどん重くなる頭で読み進めていくと、このエントリで最も重要な定義と思われるものを見つけました。

でもそれは問題じゃない!!!

まるで『微笑む誇り高き放浪者』の「ひまわりマニュアル」を見ているようだ。去勢していないので、いくら高度な剣術を駆使しても一方的で、ただただすごいだけなのだ。この時点で、間違った方法で開けていたためであり、最初から間違っていた(自分自身を去勢しなければならなかった)ことがようやくわかりました。

そこで、やり方を変えて、今回は中学校の数学を使って開きます。

まずは線形関数から始めましょう

中学校の数学では、次のような問題によく遭遇します。

  • 平面上の 3 つの点の座標 (x, y) A(1,3)、B(2,5)、C(3,7) が与えられている場合、x=5 のときの y の値を求めます。

このような問題に直面した場合、まず図に示すように、3 つの点を座標軸上に配置して確認することができます。

3 つの点は直線上にあり、線形関数の特性に一致していることがわかります。次に、この直線の方程式を見つけ、方程式に x=5 を代入するだけで、この時点での y の値がわかります。

この時点で、疑問は次のようになります。

  • 3つの点A(1,3)、B(2,5)、C(3,7)が与えられた場合、水平座標と垂直座標の関係は線形関数に従います。

x=5 のときの y の値を求めます。

この時点で、問題は中学校レベルの知識になっています。3 つの点 A、B、C を y=kx+b に代入して k と b に関する連立方程式を作成し、それを解くと次のようになります。

そして、x=5 のとき、y は 2*5+1=11 になります (私に任せてください、計算できます)。

考えるべき質問

機械学習は、上記に似たプロセスに過ぎません。一定量の入力データ(x)と出力データ(y)が与えられたら、これらのxとyの関係を表す関数を見つけます。この関数に基づいて、xがわかっている条件下でyを簡単に計算できます。たとえば、オンラインで買い物をした後にコメントを入力すると、システムが自動的にそれが良いレビューか悪いレビューかを識別できます。

上記の場合の関数をモデル、x を特徴、y を機械学習で予測する結果、x と y の既知の組み合わせをトレーニング データと呼びます。トレーニング プロセスは、x と y の関係を見つけるプロセスです (ホイップするプロセスではありません)。

しかし、実際の機械学習のケースはそれほど単純ではないことがよくあります。 1 つの機能 x のみを持つ関数が、より複雑なビジネス ニーズをどのように満たすことができるのでしょうか。

「1つがダメなら、2つ。2つがダメなら、3つ。3つがダメなら、さらに追加できます。料金を支払うだけです。話がそれてすみません!」

複数の特徴がある場合でも、上記の線形関数の基礎に基づいてモデルの仮定を立てることができる。

これで問題は解決できます。これは機械学習におけるより基本的な線形回帰です。

これらの関数は値を計算するだけで意味がないと思われる場合は、どのコメントが適切で、どのコメントが適切でないかを識別するのを手伝ってもらえますか?

「もちろん問題ありません! y の結果を 0 から 1 の間にマッピングし、y を判断するだけです。y>=0.5 は良いレビューを意味し、y<0.5 は悪いレビューを意味します。このマッピング関数を活性化関数と呼びます。理解できれば、どのように実装するかは気にしません。」

これは、機械学習における分類タスクのロジスティック回帰を実装します。

1 つの特徴が 1 つの重みに対応し、その重みが少し低く、多くのものが線形関係にないと考えられる場合、この問題をどのように解決すればよいでしょうか?

「1 層の重量が足りない場合は、さらに追加します。それでも足りない場合は、さらに追加します。」


もっと欲しい?もう少し追加します

上記のプロセスはちょっと行き過ぎて、偶然にディープラーニングのレベルに到達しました。道のりは長くて困難で、私のIQは少し遅れています...(そのため、代わりに省略記号を使用します)

要約する

上記のケースは機械学習における教師あり学習のプロセスにすぎません。実際の機械学習はこれよりもはるかに複雑な場合が多いです。また、教師なし学習と半教師あり学習に分けられます。ここでは詳細には触れません。機会があれば書きます。ではまた!

<<:  機械学習は簡単になっていますが、ソフトウェア エンジニアリングは逆の方向に進んでいます...

>>:  DAMOアカデミーの医療AIは、整形外科手術における歴史的課題を解決し、解剖学的位置を0.3秒で特定します。

ブログ    

推薦する

快手とインテルが提携し、KGNN プラットフォームでの大規模リアルタイム動的グラフトレーニングの効率を向上

ショートビデオの推奨やソーシャル推奨などのアプリケーションシナリオでは、推奨システムは大量の急速に変...

...

Laiye Technology、RPA専用に設計されたAI機能プラットフォーム「UiBot Mage」をリリース

俊敏性、効率性、コスト管理性に優れたデジタル変革手法として、中国市場に参入後、高い注目と幅広い受け入...

すべてを圧縮するだけです! OpenAIの主任科学者イリヤ・スツケバーが教師なし学習に注目

最近、OpenAI の主任科学者 Ilya Sutskever 氏が、計算理論の研究に重点を置く S...

...

IT ライフ: 遺伝的アルゴリズムを使用してコンピューターに歌詩を書かせる

出会いは幻想的で、窓の外はまた夜明けだった。弦楽器の音とかすかな笑顔をいつも思い出すが、世の中に花が...

マイクロソフトリサーチアジアと教育省が協力し、AI産業と教育の統合に向けた双方にメリットのあるエコシステムの構築に取り組んでいます。

マイクロソフトリサーチアジアは、「中国の大学における人工知能人材の国際トレーニングプログラム」に関す...

ウェブページを出力できるAIアプリが登場、早速評価してみよう

みなさんこんにちは、カソンです。最近、ウェブページ作成ツールframer[1]は、プロンプトワードに...

AI チップ: なぜそれほど重要なのか?

周りを見渡せば、人工知能がいかに重要になっているかがわかるでしょう。顔認識カメラでも音声アシスタント...

高齢者介護の問題がますます顕著になり、人工知能が大きな注目を集めている

[[431999]]新しい世代が古い世代に取って代わると、古い世代はどこへ行くのでしょうか。今日、2...

...

...

...

優れたオープンソースの音声認識/音声テキスト変換システム 5 つ

音声テキスト変換 (STT) システムは、その名前が示すとおり、話された言葉を後で使用するためにテキ...

AI-WAN: AIOps と SD-WAN が出会うとき

[[320126]] [51CTO.com クイック翻訳]ソフトウェア定義広域ネットワーク (SD-...