機械学習の経験を人生の指針に活用する: 学習効率を最大化する方法

[[185313]]

原作者 | ライムンド・マンテローラ

編集チーム | Aileen、Huang Wenchang、Fan Yuecan

コンピュータを「トレーニング」した経験に基づいて、人間に新しいスキルを習得させることが可能だと言ったらどう思いますか?

この投稿では、機械学習の仕組みの分析については詳しく説明しません。ただし、AI を独自の学習に適用する方法を説明する前に、いくつかの基本的な概念を理解していただきたいと思います。

私たちは皆、犬の写真が大好きです。犬の写真を見ると、4本足の友達と遊んだ早朝の思い出が思い出されます。

私たちは犬の姿を何千回も見てきたので、写真に写っている犬を簡単に認識できます。

しかし、犬がどんな見た目なのか興味があるという理由でエイリアンがあなたを誘拐したら、どうしますか? エイリアンは犬を誘拐して自分の惑星に持ち帰れるように、犬の見分け方をあなたに教えるよう強要します。

覚えておいてください、彼は犬がどんな姿をしているのか全く知らないのです。何をする？

犬には足が 4 本、目が 2 つ、耳が 2 つあるなど、いくつかの「ルール」を教える必要があるかもしれません。ただし、ルールが多すぎるため、これは思ったほど簡単ではないかもしれません。想像してみてください。犬とオオカミの区別をどうやって教えるのでしょうか? 本当に難しいです。

いくつかのルールを設定し、それに従って望ましい結果を得るというこの学習プロセスは、「演繹学習」と呼ばれます。しかし、すべての起こりうる変化を考慮することが難しいという点が問題です。

彼に犬の写真を 1,000 枚見せ、また犬以外の写真も 1,000 枚見せることを想像してください。そうすれば物事がずっと簡単になります!

これが私たち人間が学ぶ方法です。何千もの観察を通じて、私たちは犬がどのような外見をしているかを知っています。私たちの脳が認識できるものを見ると、特定の神経領域の活動が増加します。しかし、全米研究評議会が発行した「How People Learn（人はいかに学ぶか）」という本によると、人間はこれらの神経特性を持って生まれるわけではない。年齢を重ね、経験を積むにつれて、私たちの脳はこれらのつながりをどのように作るか理解し始めます。

驚くべきことに、機械学習はまさにこのように機能します。機械学習モデルを構築するとき、私たちは「ルール」を教えるわけではありません。代わりに、望ましい結果を生み出す可能性のあるケースと生み出すことができないケースを多数提供し、人間の脳と同じように、コンピューターがそれらを自動的に分類できるようにします。

ほとんどの人は AI を仕事を自動化するツールだと考えていますが、人間のように動作するアルゴリズムの構築に重点を置くべきです。たとえば、Facebook の顔認識アルゴリズムは理論的には人間よりも優れています。しかし、その逆をしたらどうなるでしょうか?

機械学習はどのように機能するのでしょうか?

エアコンやプールがないと暑い夏に耐えられず、隣人の家に忍び込んで、その人が留守のときにプールを使うことにしたとします。

彼はテニスをしているのでほとんど家にいないことはすでにご存知でしょう。そこで、AI スキルを適用して、天候条件に基づいて彼がテニスをプレーするかどうかをモデル化することにしました。

数週間にわたって彼を観察し、関連データを収集した後、次の表にまとめました。

適切な代表的なデータが得られたので、モデリングを開始できます。

さまざまなアプローチがありますが、ここでは決定木と呼ばれる手法を使用して分類の問題について簡単に説明します。

上の表のどの変数が、隣人がテニスをするかどうかの決定に影響を与えると思いますか? おそらく天気でしょう。

決定木の構築方法を理解するために、モデルはどの変数がデータを最も適切に分割できるかを見つけます。気象条件を決定木のルートに置き、決定木が次のようになるまで、同じ方法でさらにブランチを構築していきます。

モデルをトレーニングすると、隣人が家にいるかどうかを予測するのに役立つ決定木が作成されます。

「一体これがどうやって新しいスキルの習得に役立つのだろう？」と思うかもしれません。

学習の成果を最大限に高めるために使用できる優れた理論を開発したい場合は、従うべきいくつかの主要なルールがあります。

機械学習についてさらに詳しく知りたい場合は、ここに優れたリソースがあります。

練習、練習、練習 — たくさんのデータを収集する

すでに優れているときに練習するのではなく、継続的に練習することで、優れた人になることができます。

--マルコム・グラッドウェル

これは非常に簡単です。練習すればするほど、上達します。

私たちは皆、「ビッグデータ」という人気の用語を聞いたことがあるでしょう。しかし、彼の本当の意味を本当に理解している人はほんのわずかです。オックスフォード辞典によると、ビッグデータとは、コンピューターが分析してその特性、傾向、関連性、特に人間の行動に関連するものを示す必要がある非常に大規模なデータセットのことです。

ビッグデータとは、大量の例を使用してモデルをトレーニングすることです。

スキル学習の神経メカニズムに関するオックスフォード大学の研究によると、何か新しいことを学び始めるとき、そのプロセスには多くの神経活動が伴うそうです。しかし、同じ作業を何度も繰り返し練習すると、毎回それを完了するために必要な精神的努力の量は徐々に減少します。

機械学習モデルを構築する場合、これによってアルゴリズムのパフォーマンスが大きく決まります。良いモデルを得るには、非常に多くの例が必要です。宇宙人に数枚の写真を見せるよりも、より多くの例を見せたほうが、宇宙人はよりよく学ぶだろう。

しかし、変わらないのは、大量のデータに基づく単純なモデルが、少量のデータに基づく複雑なモデルよりも優れているということです。

——アロン・ハレヴィ、ピーター・ノーヴィグ、フェルナンド・ペレイラ、Google。データの不合理な有効性。

私たちは、あるトピックについて学んだり、読んだり、ビデオを見たり、人に尋ねたりするのに多くの時間を費やしますが、実際にそれを実践するまでには、まだ長い間躊躇してしまいます。

上達できる唯一の方法は練習することです。

暗記しない：過剰適合を避ける

学生時代を振り返ってみると、数学の問題の解答を暗記したのに、試験の問題が暗記したものと少し違っていたために解けなかったという経験はありませんか? 同じ概念ですが、その小さな違いがあなたの方法を無価値にしてしまう可能性があります。

プロセスを丸暗記した場合も同じことが起こり、問題を一般化して、これまで見たことのない状況を解決する能力が失われます。

機械学習では、これを過剰適合と呼びます。これは、モデルを記憶によって学習するようにトレーニングすると発生します。これは実際には非常に危険です。同じデータセットを使用してテストすると、100% 適合する可能性がありますが、これまでに見たことのない問題に遭遇すると、パフォーマンスが非常に低下するからです。

マウスをクリックするだけで問題を解決できることがわかっていれば、暗記する必要はありません。

これが多くの人がプログラミングを学べない理由です。覚えることが多すぎるため、自信を失ってしまいます。しかし、それが問題なのです。私が知っているプログラミングが得意な人は皆、Google でも得意なのです。

エリック・マズイ（ハーバード大学物理学教授、『Peer Instruction』の著者）の研究によると、インタラクティブな学習を通じて学習した場合、生徒の問題理解は暗記を通じて学習した場合よりも 3 倍高くなります。

アイデアはシンプルです。指導なしで自分自身に学習を強制するのです。自分でいくつかの原則を理解したら、プロセス全体を見直すことができ、理解せずに暗記することを避けることができます。

トレーニングに変化を持たせる: 多様で代表的なデータを準備する

同じことを何度も繰り返してやれば、最終的には専門家になれるとよく考えます。たとえこれで進歩できたとしても、もっと速い方法があります。練習そのものだけでなく、練習の仕方も重要です。

最も重要なことは、学習を多様化することです。

最高のギタリストは複数のジャンルを演奏します。だからこそ、ロックスターはロックだけを演奏していては最高のギタリストにはなれないのです。頂点に到達するには、さまざまなジャンルの音楽で絶え間ない実験と練習が必要です。これらすべての異なるタイプの資質は、ギタリストが万能の達人になるために役立ちます。

ブルースを知らなければ、ギターでロックや他のポピュラー音楽を演奏することはできません。

——キース・リチャーズ

ある分野で何かを達成するには、同じことを何度も繰り返すだけではだめです。より普遍的な機能を持つためには、行うことを変化させる必要があります。

さまざまな状況を表すデータを使用して機械学習モデルをトレーニングすることが重要です。

宇宙人の友達に椅子がどんなものかを教えたいなら、さまざまな視点からさまざまな種類の写真を必ず提供する必要があります。

次に新しいスキルを学びたいときは、できるだけ多くの異なる視点から学ぶようにしてください。

タイヤを再発明するのではなく、転移学習を学ぶ

シリコンバレーでは、新しい仕事分野に転向して大成功を収める人がたくさんいます。建築家がデザイナーになったり、弁護士が営業担当になったり、エンジニアがマーケティング担当者になったり、といったケースもあります。興味深いことに、彼らは皆、以前の仕事で学んだ知識の多くを新しい仕事に応用できることに気づいています。

人工ニューラルネットワーク（主に画像認識に利用）の分野には転移学習と呼ばれる技術があります。全体を再構築する代わりに、新しいタスクに使用したいタスクに類似した、以前にトレーニングされたタスクの一部を使用できます。ご想像のとおり、これによりモデルのパフォーマンスが向上し、多くの時間を節約できます。

ギター奏者の例を思い出してください。すでにピアノの弾き方を知っていれば、ギターを学ぶのはおそらくずっと簡単でしょう。これらは全く異なる楽器ですが、基本的な音楽の知識は普遍的です。

最も重要なことは、脳内にすでに備わっているつながりを活用して、それをさまざまなスキルに適用することを学ぶことです。

スケートボードのスキルがスノーボードにも応用できるのと同じです。

すでに知っていることを応用することで、新しいことをすぐに習得できます。

機械学習は新しいものではなく、何十年も前から存在しています。ゆっくりとしたプロセスでしたが、その成果は今や現れ始めています。今、私たちには大きな影響を与えるためのリソースがあります。先週、私は Gigaom AI 2017 カンファレンスに出席しました。そこで Jerry Kaplan 氏は、現在の時代は歴史的に車輪の発明に匹敵する時代であると述べました。

これらの神秘的なブラックボックスがどのように機能するかについて大まかに理解できたので、AI を詳しく調べてみることをお勧めします。私たちに必要なのは、エンジニアやデータサイエンティストだけではありません。舞台裏ですべてがどのように機能するかを理解し、このテクノロジーの力を新しい分野に適用できる人材も必要です。

AIは電気のような次世代の発明であり、次々と産業を変革し続けるでしょう。

——アンドリュー・ン

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest（id: BigDataDigest）」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<: 人間の言語を話せる人工知能はより価値がある

>>: Agora.io がモバイルゲーム向けリアルタイム音声サービス「AMG Voice」を開始