退屈な「機械学習」がこのように学べるとは思ってもいませんでした!

退屈な「機械学習」がこのように学べるとは思ってもいませんでした!

[[234276]]

機械学習は、確率論や統計などの複雑な分野を含む人工知能の中核分野の 1 つです。専門家でない人にとっては理解するのは容易ではありません。

最近、Ant AIプラットフォーム部門のBai Ningが散歩中に「機械学習」を説明する鍵を見つけ、面白く分かりやすく「機械学習」を説明しました。以下で一緒に学びましょう!

著者: 白寧 (朱白寧)、Ant Financial AI プラットフォーム部門のシニア プロダクト エキスパート

5月末の正午、Ant AIプラットフォーム部門のPD学生数名がLao Niangjiuで食事をした後、Z Spaceの階下を散歩しました。

授業中、クラスメイトが「些細なことで子どもがバカなことをする」というニュースを取り上げました。

皆がため息をついていた時、プロダクトの専門家である同級生が、この子の「モデルは過剰適合していて、一般化能力が低すぎる」と生々しく言った。

この比喩は本当に的を射ています!このレベルの理解力があれば、この学生が研究員に昇進し、組織部門を担当するのにもすぐにはかからないだろうと皆が言っていました。

実際、甘やかされて(過剰適合されて)形成された脆弱な心(モデル)は、現実世界のさまざまな失望に正しく対処できないことが多く(不正確な予測、一般化能力の低さ) 、それが簡単に悲劇につながる可能性があります。

機械学習では、モデルをトレーニングするときに、サンプルが単一すぎる場合や特徴の選択が不適切である場合、過剰適合が発生します。つまり、トレーニング サンプル内の特殊なケースを一般的なケースとして扱います。この方法では、新しいサンプルに直面したときに、正しく処理することができません。

よく言われる試験重視の教育と質重視の教育も、一般化能力に大きな違いがあります。

試験重視の教育では、学生は一日中論文を解いたり、問題集を復習したりする必要があります。訓練されたモデルは過剰適合しており、一般化能力が低いため、「得点は高いが能力が低い」という状況に陥ります。一方、品質重視の教育は能力の訓練に重点を置き、より多様化しています。訓練されたモデルは強力な一般化能力を備えているため、学生は将来の生活や仕事であまり問題を抱えることはありません。

[[234278]]

実際、人間の成長と機械学習を注意深く比較すると、両者には多くの類似点があることがわかります。

赤ちゃんは生まれると、心拍、呼吸、泣き声、笑い声、恐怖感などの特定の能力(独自のアルゴリズム ライブラリ付き)を持って生まれます。

これらの能力は魔法のような進化と優れた遺伝子によってもたらされました。そうでなければ、これらのスキルをもう一度習得するのは大変な労力がかかります。

[[234279]]

もちろん、普通の生活を送るためには、これらの基本的なアルゴリズムやモデルを組み込むだけでは十分ではなく、常に新しいスキル(独自に開発したアルゴリズム)を習得する必要もあります。

例えば、食べること、歩くこと、話すことなどです。

これらのスキルを習得するには、親が私たちに毎日、何年も繰り返し教え、最初の喃語から最初の一歩まで訓練する必要があります。

これは機械学習とまったく同じで、モデルを取得するには十分なサンプル (数万)、大量のコンピューティング リソース、数分、場合によっては数時間、あるいは数日にわたる継続的なトレーニングが必要です。

実は、人間の脳には、長年の継続的な訓練を通じて習得されたスキル(モデル)だけでなく、いくつかの強力なルールも存在します。

これらのルールの一部は両親から教えられたものであり、一部は社会倫理、法律、規制によって形成されたものです。

たとえば、親は子どもに「知らない人からもらった食べ物を食べてはいけない」とか「道路を渡るときは左右をよく見て」などと教えます。

人生においては、年長者を敬い、若者を愛し、他人に礼儀正しく接し、法律や規則を遵守し、社会主義の核心価値観を実践するなどすべきです。

私たちはこれらのルールを覚えておき、今後はそれに従う必要があります。

私たちの脳は、無数のルールとモデルを含む意思決定センターまたは意志決定センターのようなものだと言えます。

。すべての決定は、これらのルールとモデルの組み合わせを使用して行われます。

実際の機械学習の応用シーンでは、DaquanのUCT、WeidaiのAGDS、DecisionXなどの「総合意思決定センター」など、さまざまな業務ラインに同様の「意思決定センター」が数多く存在します。

この意思決定センターには、何百もの複雑なルール (または「戦略」) とトレーニング済みのモデルが含まれています。特定のケースでは、戦略やモデルを組み合わせて判断や決定を下します。

また、まずは戦略が判断されることが多く、ある戦略が満たされない場合は、直接決定が下されます。

私たちは年を重ねるにつれて、食べる、飲む、排便する、排尿するといった基本的なスキルに加えて、中国語、数学、音楽、ダンス、スポーツなど、より多くのスキルを意思決定センターで習得する必要があります。

この点では、私たちは「才能に恵まれた」子供たち、つまり、彼らのシステムには超強力なアルゴリズムが備わっている子供たちをよく目にします。彼らの親は彼らからより優れたアルゴリズムを受け継いでいるのです。

しかし、私たちのような一般人は落胆する必要はありません。もっと努力し(サンプルを大きくし)、意図的かつ熱心にトレーニングを続け(モデルを継続的に再トレーニングして進化させ)、良い結果を達成することもできます。

人生はマラソンであり、モデルのトレーニングも同様です。

[[234281]]

対照的に、このマラソンでは、人生のさまざまな年齢で、さまざまな学習方法を使用します。

私たちが若かった頃は、主に教師あり機械学習を使用していました。

たとえば、親は私たちにさまざまな果物を掲げて「これはリンゴだよ、これはオレンジだよ」と教えてくれました。

漫画や物語の本では、誰が善玉で誰が悪玉なのかがよく描かれています。

したがって、最も一般的に使用されるアルゴリズムは、大きい/小さい、長い/短い、はい/いいえ、良い/悪いのバイナリ分類アルゴリズムです。

[[234282]]

私たちは成長するにつれて、より多くの教師なし学習や半教師あり学習に遭遇し、多くの物事には正しいか間違っているかの明確なラベルが付いていません。

したがって、いくつかのクラスタリング アルゴリズムを使用します。しばらく会って人々と知り合った後、彼らを「忠実」、「アルコール耐性が高い」、「コンピューターの修理ができる」、「老婆酒が大好き」などのカテゴリーに分類します。

[[234283]]

学習方法は様々ですが、真実は単純で、すべては同じです。

ある分野で何かを達成した人は、他の分野でも優れた成果を上げるのは簡単だ(転移学習)ということはわかっています。

たとえば、アインシュタインは優れた科学者であっただけでなく、バ​​イオリンの演奏にも長けていました。 C 言語の専門家はすぐに Java の専門家になることができます。

もちろん、よく見てみると、人間の脳と機械学習の間には多くの違いがあります。

たとえば、子供におもちゃの車を数台渡して遊ばせ、車の絵をいくつか見せれば、さまざまな形や絵柄の車を認識できるようになります。

対照的に、機械がこのような一見単​​純な能力を達成するには、トレーニングに数万または数百万のサンプルが必要です。

数年にわたり、AutoML の研究方向の 1 つは、少数のサンプルでモデル トレーニングを完了する方法を解決することでした。

[[234284]]

さらに、人間が「無意識に、一瞬で」できることが、人工知能にとっては難しいことも分かりました。

例えば、物や人を認識する能力(画像認識能力)、喜び、怒り、悲しみ、幸せなどの感情、歩く能力や走る能力などです。その理由は偉大な進化によるものです。私たちのこれらのモデルは、数十億年の進化と数え切れないほどのモデルの進化を経て得られたものです。

一方、人間が完了するのに長い時間がかかる作業も、コンピュータにとっては簡単です。たとえば、短時間で 100 万個の数字を合計したり、円周率を小数点以下 100 万桁まで計算したりします。

[[234285]]

しかし、人間の脳と人工知能の能力の違いの背後にある本当の理由を見つけるには、まだ長い道のりが残っています。

テクノロジーは急速に進歩しており、人々は人工知能(ディープラーニング)を実現し、機械が猫を認識したり囲碁を打ったりできるようにするために「ディープニューラルネットワーク」を発明しましたが、人間は自分の脳の働きについてまだほとんど知りません。

人々は、原理がまだ不明(説明不能)な魔法の脳を使って、仕組みがまだ不明(説明不能)なあらゆるモデルを作り出していると言えます。

つまり、ディープラーニングを使用して猫を認識できるモデルをトレーニングしたとしても、このモデルは解釈可能ではありません。つまり、トレーニングしたこの素晴らしいモデルが猫を識別するためにどのような機能と原理に依存しているかはわかりません。

[[234286]]

人間の心は、このような無数の不思議なモデルと明確なルールで構成されています。

人の人生は、古いアルゴリズムを絶えず繰り返し、古いモデルを再トレーニングし、新しいアルゴリズムを開発し、新しいモデルをトレーニングするプロセスです。

「1 万冊の本を読み、1 万マイルを旅し、1 万人の人と話す」ということわざがあります。これにより、より多くのアルゴリズムを習得し、より包括的なサンプルを入手し、より多様なモデルをトレーニングできるようになります。

しかし残念なことに、「容姿、泣き方、笑い方」といった特徴やスキルとは異なり、人間のモデルのほとんどは遺伝子を通じて子供たちに受け継がれることができません。

たとえば、「Java/Python に精通し、デバッグやコアチューニングが得意」な上級技術専門家 (P8) と、「ユーザーエクスペリエンスと人間性に精通」している上級プロダクトマネージャー (P6) を組み合わせた場合、その子孫はコードを書いたりワイヤーフレームを描いたりする能力を持って生まれることはありません。

言い換えれば、生涯を通じてトレーニングしてきたすべてのエレガントなモデルは、最終的にはオフラインになります (モデルがオフラインになります)

[[234288]]

しかし、悲しむ必要はありません。人生は美しさと興奮を経験するプロセスなのです。

人は生涯を通じて学び続けるべきであり、そうして初めて人生は充実し、楽しみにできるとよく言われます。

つまり、Ant Financial の AI プラットフォーム部門は、機械学習、ビッグデータ インテリジェンスなどの分野で、国内外から多くのエリートを集めており、同部門の製品は Ant Financial のコア製品や事業の多くを支えています。

このチームは才能があり知識が豊富であるだけでなく、情熱的で誠実で興味深いチームです。

<<:  大学における人工知能への熱意を「クール」に振り返る

>>:  ワールドカップで物議を醸したVARテクノロジーはどのようにして生まれたのでしょうか?

ブログ    

推薦する

シリコンバレーの大手企業のAIスタートアップへの投資レイアウトを解明! Nvidiaが全力で取り組み、MicrosoftとOpenAIの関係が独占禁止法調査につながる

今年、新たな AI スタートアップ企業がシリコンバレーとビジネス界全体に衝撃を与えました。 Open...

Uberの自動運転車の死亡事故から忘れてはならない10の教訓

自動運転技術は常に注目を集めてきたが、「幻滅」に直面している。これによって起きた初の交通事故死は、1...

...

画像はさまざまな方法で変更できます。NVIDIAはGANを使用して高精度のディテールレタッチを実現

[[436122]] EditGAN は、複雑かつ高精度な画像編集効果を実現しながらも、高い画像品質...

...

世界的なIT大手はAIを活用してデータセンターのエネルギー節約と排出量削減に取り組んでいる

データ センターは、世界中の何十億もの人々が毎日使用するアプリケーション、Web サイト、サービスに...

自然言語処理の実践: 機械学習によく使われるツールとテクニック

多くの自然言語処理には機械学習が関係しているため、機械学習の基本的なツールとテクニックを理解しておく...

写真をビデオに変換するには、指 1 本だけが必要です。 Gen-2スポーツブラシが無料で利用可能になりました。ネットユーザー:史上最高のアップデート

「ポイント」すると動きます。Gen-2の新機能「マジックブラシ 馬亮」が正式にリリースされました。無...

...

...

...

...

人間の動作生成を再構築し、拡散モデルと検索戦略を統合した新しいパラダイム、ReMoDiffuseが登場

人間の動作生成タスクは、エンターテインメント、仮想現実、ロボット工学などの分野のニーズを満たす、リア...

マイクロソフトとOpenAIが訴えられた後、アップルはニュース出版社とAIモデルのトレーニング費用の支払いについて交渉している

Appleは、AIモデルのトレーニングと開発のためにニュース資料にアクセスするために、いくつかの国際...