「機械学習には数学は必要なく、多くのアルゴリズムがパッケージ化されており、パッケージを調整するだけでよい」という主張についてどう思いますか?

「機械学習には数学は必要なく、多くのアルゴリズムがパッケージ化されており、パッケージを調整するだけでよい」という主張についてどう思いますか?

[[205087]]

あまり巧妙になりすぎずに、機械学習の学術界に触れ、すでに業界に入った人間の視点からお答えしたいと思います。

機械学習の実践者のほとんどは、数学に多くの時間と労力を費やす必要はなく、さまざまなアルゴリズムの適用シナリオに慣れ、いくつかのパラメータ調整テクニックを習得するために数学を使うべきだと私は思います。優れた数学的基礎があればモデルを簡潔かつ効率的にすることができますが、それが前提条件というわけではありません。

理由は次のとおりです。

1. ある程度の数学的基礎があっても、パラメータを調整したり最適化を実行したりする方法はまだわかりません。

これは少し自虐的に聞こえるかもしれませんが、自分自身に問いかけてみてください。精度が良くなく、損失が非常に高く、モデルが過剰適合していることに気付いたとき、数式をすばやく書き出して行列を操作することで、どこに問題があるのか​​を突き止めることができますか? 必ずしもそうとは限りません。確かに、より多くの統計原理を知ることは、問題がどこにあるのかを推測するのに役立ちます。損失関数を変更したり、新しい正規化子を追加したりすることはできますが、結果が必ずしも良くなるとは限りません。

機械学習の実践者にとって、数学的基礎はプログラマーにとってのデバッガーのようなものです。デバッガーは指示を与えてくれますが、問題を解決できることを保証するものではありません。では、どうすればこの問題を解決できるのでしょうか? 経験、経験、そして経験しかありません。他に方法はなく、時には直感に頼らなければならないこともあります。数学の基礎は内面的な強さの基礎として良いですが、もっと頻繁に物事を切り替えると、徐々にコツをつかむことができるので、「物事を切り替える」人を軽蔑する必要はありません。

2. 業界で適用できるモデルは非常に限られており、調整可能なパラメータも限られています。

業界では、モデルを選択する際に、説明可能性、効率性、システム全体との統合能力を非常に重視しています。たとえば、私の仕事では、回帰や決定木関連のアルゴリズム (ランダム フォレストなど) の使用にほとんどの時間を費やしています。これら 2 つのアルゴリズムが最適だからでしょうか? いいえ、これら 2 つのアルゴリズムは安定しており、効率的で、説明が簡単だからです。このようなモデルの場合、数学的なスキルが優れていても、調整できるパラメータは限られています。オンラインの例と経験に基づくと、多くのエンジニアは数学の基礎が弱くても良い結果を達成できます。

3. 数学/統計の知識は、既得権益者によって部外者に対して意図的に築かれた障壁となっている。

皆さんのうち何人が ML 研究に携わっているかはわかりません。私の個人的な観察では、成果を上げている ML 研究者の数は限られており、正式なトレーニングを受けた研究者が業界の空席を埋めるにはほど遠い状況です。したがって、転職した人に仕事を奪われるのではないかと心配する必要はなく、機械学習を行う資格を得るために行列や凸最適化などの数学的知識を理解していなければならないとわざわざ主張する必要もありません。私たちは皆、自分自身を売り込むためにここにいるので、お互いに物事を難しくする必要はありません。正直に言うと、職場の上司に「この人は使えない、私のような専門的な経歴のある人を使った方がいい」とよく言いますが、心の中では賛成できません。

Zhihu で誰かが機械学習の始め方を質問し、皆がすぐに PRML や Statistical Learning、そしてたくさんのオープン コースや数学のコースを読むことを勧めるのを見ると、私は心が痛みます。あなたの目標は皆を怖がらせることですか、それとも自分の優位性を誇示することですか?

4. 理論モデルと実際のアプリケーションはまったく別のものです。

2 番目と 3 番目のポイントに続いて、理論研究を行う者はブレークスルーに焦点を当て、新しいモデルや最適化手法を提案する必要があり、一方、応用研究を行う者はモデルをデータに適用し、商業的価値を獲得するよう努める必要があります。両者の間には利益相反はありません。理論を唱える人は正統派の雰囲気を醸し出すという利点があるため、より寛大に見えるはずです。この業界は、より多くの人々が「スイッチング」に取り組むことでのみ繁栄するでしょう。なぜなら、それは技術が実装され、実用的な価値をもたらすことができるということを証明するからです。

5. 業界の傾向としては、ツールを使いやすくすることであり、これにより車輪の再発明をせずに済みます。

Amazon、Google、Microsoft などの大手プラットフォームは、機械学習ツールを公開しています。以前は、さまざまなモデルを自分で記述する必要があり、より良いモデルは sklearn によって調整されていましたが、現在は Azure ML Studio によってコードが不要になるほど便利になっています。今年の初めに ML Studio を試してみたのですが、とても便利でした。グラフィックをドラッグしてつなげるだけでモデルが作れました。その時、私は自分が仕事を失いそうになったような気がしました。

6. もっと文学的な言い方をすれば、私たちはもっと寛容な態度を持ち、お互いを見下さないことが必要です。

ある主題について知りたい場合は、まずそれに興味を持ち、それから探求する意欲を持つ必要があります。 Hello Word を初めて見たときと同じように、この業界に新しく入った多くの人々は、機械学習が実用的な問題を解決できることを初めて見たとき、非常に興味を持つでしょう。

私が恐れているのは、機械学習を学び始める前に、行列分解の方法、トレースを使用した導関数の計算方法、最適化の方法を知っておく必要があると業界の人が言うことです。このサイクルは長すぎて、始める勇気すら出ない人も多いです。何事もまずは始めてみて、自分の欠点を見つけて、それから必要なものを補うのがいいと思います。

学問の世界は無料なので、私たちは扉を開いて、誰でも来て見学することを歓迎します。気に入らない場合は、隣に訪問していただいても結構です。しかし、家の入り口に高い階段を建てて、誰も入って来られないようにすべきではありません。時間が経てば、その場所が廃墟になるのは避けられません。

まとめると、機械学習のモデルや技術を適用するには、数学を全く知らない必要はなく、また実践者全員がさまざまな数学理論に精通する必要もないと私は考えています。モデルユーザーは常に理論に対する畏敬の念を持ち、「機械学習とはそういうものだ」と言って大々的に宣伝しようとすべきではありません。ただし、理論を扱う人は、自分が優れていて、他の人は二級市民であると感じる必要はありません。

よし、もう言葉はない、切り替えるよ(面白い)

<<:  インターネットの未来のために: AI が生み出すものと破壊するもの

>>:  順序保存回帰: リソース利用を最大化するアルゴリズム

ブログ    
ブログ    
ブログ    

推薦する

米国のパイロットがエイリアンの存在を確認!米国は10年間UFOのリバースエンジニアリングを行っており、マスク氏はそれを否定していない

ちょうど昨日、米国議会は、米国政府が不時着したエイリアンの宇宙船とエイリアンの遺体を発見し、それを隠...

3Dを理解する言語モデルが登場! UCLA、上海交通大学、MITなどが共同で3D-LLMを提案:パフォーマンスが9%向上

大規模言語モデル (LLM) と視覚言語モデル (VLM) は、画像からの発話や常識的な推論の実行な...

...

...

...

APPは顔認識を強制しますか?アカウントをキャンセルできませんか?国は行動を起こしている

現在、インターネット上では個人のプライバシー情報の漏洩が頻繁に発生しています。アプリは多くの場合、ユ...

機械はどのように学習するのでしょうか?人工知能の「双方向戦闘」を詳しく解説

金庸の武侠小説『射雁英雄伝』には、桃花島に閉じ込められた「悪童」周伯同が「左右の格闘術」を編み出した...

ジェフ・ディーン: 「スパースモデル設計ガイド」を作成しましたので、ぜひご覧ください。

スパースモデルは、ディープラーニングの分野でますます重要な役割を果たしています。特定のトークンまたは...

医療や旅行など多くの分野で人工知能が導入され、生産と生活の変革が加速している。

モバイルインターネットやビッグデータなどの新技術の推進により、人工知能は新たな発展ブームを迎え、実際...

AIと5Gを組み合わせてIoTの収益を最大化する方法

[[402984]]研究によると、人工知能と 5G テクノロジーを組み合わせることで、通信会社は I...

ショック! Google がショウジョウバエの脳全体を自動で再構築: 40 兆ピクセルの画像が初めて公開されました。

昨日、Google はハワード・ヒューズ医学研究所 (HHMI) およびケンブリッジ大学と共同で、シ...

ロボット犬の悩み:ネットセレブの研修生になるのは簡単だが、ビジネスの研修生になるのは難しい

ニュージーランドの広大な草原で、羊の群れがのんびりと散歩しながら草を食べており、その後ろを牧羊犬が追...

Adobe が超強力な人工知能ブラックテクノロジーをリリース、アーティストたちは職を失うかもしれない!

Adobe Make itのシェアを聞いて、Adobeの人工知能ブラックテクノロジーに衝撃を受けま...

広告および推奨システムに機械学習モデルを導入するための 2 つのアーキテクチャ

広告および推奨システムは、機械学習の最も成熟した応用分野です。では、広告システムや推奨システムでは、...

ディープラーニング:新興技術の限界を押し広げる

ビッグデータや人工知能などの新興技術は猛烈な勢いで発展しており、その一因はディープラーニングの驚異的...