機械学習の発展の歴史と啓蒙

機械学習の発展の歴史と啓蒙

[[188091]]

近年、人工知能の目覚ましい発展、特にAlphaGoと韓国のチェスプレイヤー、イ・セドル九段との最近の人間対機械の戦いは、私たちに人工知能技術の大きな可能性を認識させました。データはキャリアであり、インテリジェンスは目標であり、機械学習はデータからインテリジェンスへの技術的な道筋です。したがって、機械学習はデータサイエンスの中核であり、現代の人工知能の本質です。

簡単に言えば、機械学習とはデータから貴重な情報を抽出することです。データ自体は無意識であり、有用な情報を自動的に提示することはできません。何が価値があるかをどのように見つけることができるでしょうか。最初のステップは、データに抽象的な表現を与えることです。次に、その表現に基づいてモデルを構築し、モデルのパラメータを推定します。これは計算です。大規模データによってもたらされる問題に対処するには、ハードウェアやアルゴリズムのレベルを含む、いくつかの効率的な実装方法を設計する必要もあります。統計はモデリングの主なツールとアプローチであり、モデルの解決は主に最適化問題として定義されます。特に、頻度主義的方法は実際には最適化問題です。ベイズモデルの計算には、モンテカルロランダムサンプリング法がよく使用されます。したがって、機械学習はコンピュータサイエンスと統計学の学際的な分野です。

コンピューター ビジョン理論の創始者である Marr によるコンピューター ビジョンの 3 段階の定義を参考にして、機械学習も初級、中級、上級の 3 段階に分けます。最初の段階はデータの取得と特徴の抽出です。中間段階はデータの処理と分析であり、これには3つの側面があります。1つ目は、応用問題指向です。簡単に言えば、既存のモデルと方法を主に応用していくつかの実用的な問題を解決します。これはデータマイニングとして理解できます。2つ目は、応用問題のニーズに応じて、モデル、方法、アルゴリズムを提案および開発し、それらをサポートする数学的原理または理論的基礎を研究することです。これが機械学習分野の中核的な内容です。3つ目は、推論を通じて一定のインテリジェンスを実現することです。高度な段階は知能と認知であり、知能の目標を達成することです。データ マイニングと機械学習は本質的に同じです。違いは、データ マイニングはデータ側に近いのに対し、機械学習はインテリジェンス側に近いことです。

統計とコンピューティング

今年、米国科学アカデミーの会員に選出されたばかりのカーネギーメロン大学統計学部の教授、ラリー・ワッサーマン氏は、「統計のすべて」という非常に威圧的なタイトルの本を執筆した。この本の序文には、統計学と機械学習に関する非常に興味深い説明が含まれています。ワッサーマン氏は、統計はもともと統計部門にあり、コンピュータはコンピュータ部門にあったと考えています。両者は交流がなく、お互いの価値を認識していませんでした。コンピュータ科学者は、それらの統計理論は役に立たず、問題を解決しないと信じていますが、統計学者は、コンピュータ科学者は単に「車輪の再発明」をしていて、新しいアイデアはないと考えています。しかし、統計学者がコンピュータ科学者の貢献を認識し、コンピュータ科学者が統計の理論と方法論の普遍的な重要性を認識するようになったため、状況は変わったと彼は考えています。そこで、ワッサーマンは、統計学者向けに書かれたコンピュータ分野の本であり、コンピュータ学者向けに書かれた統計分野の本であると言えるこの本を執筆しました。

今では誰もが、機械学習の手法をその基本原理を理解せずに使用するのは非常に恐ろしいことだというコンセンサスに達しています。学術界がディープラーニングに対して依然として懐疑的なのは、このためです。ディープラーニングは実際のアプリケーションで強力な能力を発揮していますが、その背後にある原理はまだあまり明確ではありません。

コンピューター科学者は通常、優れた計算能力と問題解決の直感力を持ち、統計学者は理論分析と問題のモデリングに優れているため、この 2 つは非常に補完的です。ブースティング、サポート ベクター マシン (SVM)、アンサンブル学習、スパース学習は、過去 10 年から 20 年の間に機械学習と統計のコミュニティで最も活発に取り組まれた分野です。これらの成果は、統計とコンピューター サイエンスのコミュニティによる共同の取り組みの結果です。たとえば、数学者のヴァプニックらは 1960 年代に早くもサポート ベクター マシンの理論を提唱していましたが、非常に効果的なソリューション アルゴリズムがコンピューター コミュニティによって発明されたのは 1990 年代後半になってからでした。その後、多数の優れた実装コードがオープンソース化されたことで、サポート ベクター マシンは現在、分類アルゴリズムのベンチマーク モデルとなっています。たとえば、カーネル主成分分析 (KPCA) は、コンピューター科学者によって提案された非線形次元削減手法です。実際、これは古典的な多次元尺度法 (MDS) と同等です。後者は統計コミュニティでは長い間存在していましたが、コンピュータコミュニティによって再発見されていなかったら、いくつかの優れたものが埋もれていたかもしれません。

世界最高と認められている統計学部は、カリフォルニア大学バークレー校とスタンフォード大学の 2 つです。カリフォルニア大学バークレー校は、米国における統計学発祥の地の一つであり、現在では統計学と機械学習の中心地ともいえます。同校の機械学習分野の教授陣は、通常、コンピュータ部門と統計部門の両方に正式な役職を持っています。故レオ・ブレイマン教授は、統計的機械学習の創始者です。彼は、バギング、分類および回帰ツリー (CART)、ランダムフォレスト、非負ガロットスパースモデルなど、多くの統計学習手法の主な貢献者です。ブライトマンはマイケル・ジョーダン教授の指導者だった。ジョーダンをMITからバークレーに連れてくることを主張したのも彼だった。バークレーの統計学部はジョーダンを成功に導き、ジョーダンはバークレーの統計学の発展に新たな活力を生み出し、機械学習の分野で多くの優れた学者を育成し、かけがえのない貢献を果たしたと言えるでしょう。

[[188092]] [[188093]]

スタンフォード大学統計学部の主な方向性の 1 つは、統計学習です。たとえば、「統計学習の要素」という本は、統計学部の著名な教授数名によって執筆されました。スタンフォード大学のコンピュータサイエンス学部は、人工知能の分野、特に不確実性推論、確率的グラフィカルモデル、確率的ロボティクスなどの分野で常に世界をリードしてきました。 「機械学習」、「確率的グラフィカルモデル」、「人工知能」などのオンライン公開コースは、世界中の学者に恩恵をもたらしています。興味深いことに、スタンフォード大学とバークレー大学は、うらやましいほどの協力関係と競争関係を築いています。毎年開催される合同統計デーは、両大学の統計部門のコミュニケーションの場です。バークレー大学のブライトマン教授とスタンフォード大学のジェローム・フリードマン教授は協力して、多くの重要な統計学習モデルを確立しました。さらに、両校のスチュアート・ラッセル教授とピーター・ノーヴィグ教授が共著した書籍「人工知能:現代的アプローチ」は、人工知能に関する包括的な研究です。

カーネギーメロン大学は非常にユニークな大学です。米国の伝統的なアイビーリーグの大学ではありません。コンピュータサイエンスを基盤とし、機械学習部門を設立した世界初の大学ともいえます。トム ミッチェル教授は、機械学習の初期の創始者および守護者の 1 人です。同教授は、同校の学部生に「機械学習」コースを教えています。同校の統計学部も一流であり、ベイズ統計学の世界的研究センターとなっている。

トロント大学は機械学習の分野で重要な役割を果たしています。同大学の機械学習研究グループはトップクラスの学者を集めており、ScienceやNatureに画期的な論文を数多く発表しています。これは珍しいことです。ジェフリー・ヒントン教授は偉大な思想家であるだけでなく、実践者でもあります。彼はニューラル ネットワークの創始者の 1 人であり、エラー バックプロパゲーション (BP) アルゴリズムとディープラーニングの主要な貢献者です。ニューラルネットワークが大きな爆発的な進歩を遂げたのは、彼のたゆまぬ努力のおかげです。ラドフォード ニール教授はヒントン氏の学生です。同教授はベイズ統計学、特にモンテ カルロ マルコフ連鎖シミュレーション法 (MCMC) の分野で一連の重要な研究を行ってきました。また、多くのベイズ統計法パッケージをオープンソース化し、R 言語の最適化に尽力してきました。

機械学習の発展

1990 年代以前の開発プロセスについては十分な知識と理解がないため、当時の機械学習は比較的平坦な開発期間にあったと感じています。 1990 年代半ばから 2000 年代半ばは機械学習の発展の黄金時代であり、統計学習理論に基づくサポート ベクター マシン、ランダム フォレスト、ブースティングなどの統合分類方法、確率的グラフィカル モデル、再生カーネル理論に基づく非線形データ分析と処理方法、ノンパラメトリック ベイズ法、正則化理論に基づくスパース学習モデルとアプリケーションなど、学術界における多くの重要な成果の出現が主な特徴でした。これらの成果は、統計学習の理論的基礎と枠組みを築きました。

しかし、機械学習も 2000 年代後半に短期間の停滞を経験しました。当時、私はカリフォルニア大学バークレー校で博士研究員としての仕事を終えたばかりで、就職活動中でした。私の指導者であるジョーダン教授と私は何度も議論を重ねました。一方で、彼は機械学習が困難な時期にあり、すでに職が埋まっていると考えていました。他方で、統計に基づく機械学習はすでに学問分野としての地位を確立しているため、機械学習に統計を導入するというアイデアは正しいと繰り返し強調してくれました。主な問題は、機械学習が応用分野であり、産業界の実際の問題を解決するために役立つ必要があることです。幸いなことに、この期間はすぐに過ぎました。

今では、機械学習がコンピューターサイエンスと人工知能の主流の分野になったと自信を持って言えます。これは主に次の 3 つの画期的な出来事に反映されています。

***、2010年2月、カリフォルニア大学バークレー校のジョーダン教授とカーネギーメロン大学のミシェル教授が、米国工学アカデミーの会員に選出されました。同年5月、ジョーダン教授は米国科学アカデミーの会員に選出されました。その後数年間で、確率的グラフィカルモデルの専門家であるダフネ・コラーが米国工学アカデミーの会員に選出され、理論計算機科学者、機械学習の専門家であり、ブースティングの主要創始者の一人であるロバート・シャピレが米国工学アカデミーと科学アカデミーの会員に選出されました。この期間中、スタンフォード大学の統計学者フリードマンとロバート・ティブシラニ、バークレー大学の中国系アメリカ人統計学者ユー・ビン、カーネギーメロン大学の統計学者ワッサーマンも米国科学アカデミーの会員に選出された。これは非常に興味深い現象です。なぜなら、これらの学者は機械学習の分野で非常に重要な貢献を果たしてきたからです。たとえば、フリードマンの研究には、分類および回帰ツリー、多変量適応回帰スプライン (MARS)、勾配ブースティングマシン (GBM) などの古典的な機械学習アルゴリズムが含まれており、ティブシュワニは最小絶対収縮および選択演算子 (LASSO) の考案者です。また、最適化アルゴリズムの専門家であるスティーブン・ボイド氏は米国工学アカデミーの会員に選出されました。リーヴェン・ヴァンデンベルゲ氏との共著『凸最適化』は機械学習コミュニティで人気があると言えます。今年は、機械学習の専門家であり、ディープラーニングの先駆者であるトロント大学のヒントン教授と、同大学の統計学習の専門家であるナンシー・リード氏が、それぞれ米国工学アカデミーと米国科学アカデミーの外国人会員に選出された。

ジョーダン教授は、私の学術会員選出のお祝いに対する返事の中で、機械学習に対する学術界の認知を、自身の学術会員選出と同じように捉える方が有意義であると述べました。したがって、ある学問分野が米国で主流の学問分野として受け入れられるかどうかの重要な指標は、その学問分野を代表する科学者が学者として選出されるかどうかであると私は理解しています。ミシェルは機械学習の初期の創始者の一人であり、ジョーダンは統計的機械学習の主要な創始者の一人であったことは知られています。

2 つ目は、2011 年のチューリング賞はカリフォルニア大学ロサンゼルス校の教授であるジュディア・パール氏に授与されたことです。パール氏の主な研究分野は、機械学習の基本的な問題である確率的グラフィカル モデルと因果推論です。チューリング賞は通常、純粋理論コンピュータサイエンスの学者、または初期にコンピュータアーキテクチャやフレームワークを確立した学者に授与されます。パール教授にチューリング賞を授与することは、方向性を示すものです。さらに、昨年は『サイエンス』誌と『ネイチャー』誌が機械学習に関するレビュー論文を4本連続で発表しました。さらに、近年、これら 2 つのジャーナルに掲載されるコンピューター サイエンスの論文はほぼすべて、機械学習の分野からのものです。

3 つ目は、機械学習は実際に業界の問題解決に役立てることができるということです。特にディープラーニング、AlphaGo、自動運転車、人工知能アシスタントなど、業界に大きな影響を与える現在のホットなトピックです。今日の IT 開発は、従来の Microsoft モデルから Google モデルに移行しています。従来の Microsoft モデルは製造業として理解できますが、Google モデルはサービス産業として理解できます。 Google 検索は完全に無料で、社会に貢献しています。Google 検索はますます人気が高まっており、Google 検索によって生み出される富も増加しています。

富はデータの中にあり、富を掘り出すための中核技術は機械学習であるため、Google は自らを機械学習企業とみなしています。ディープラーニングは、今日の機械学習の最もダイナミックな方向性として、コンピュータービジョン、自然言語理解、音声認識、知能ゲームにおいて破壊的な成果を達成し、新興スタートアップ企業のグループを生み出しました。業界では機械学習分野の人材に対する需要が非常に高くなっています。優れたコーディングスキルを持つエンジニアだけでなく、数学的モデリングと問題解決のスキルを持つ科学者も必要です。

最近出版された「Foundation of Data Science」という未出版の本があり、その著者の一人はチューリング賞受賞者のジョン・ホップクロフトです。この本の最先端の部分では、コンピュータサイエンスの発展は初期、中期、現在の 3 つの段階に分けられると述べられています。初期の頃は、コンピューターを動かすことに重点が置かれ、プログラミング言語、コンパイル技術、オペレーティング システムの開発と、それらを支える数学理論の研究に重点が置かれていました。中期目標は、アルゴリズムとデータ構造の研究に重点を置き、コンピューターを有用かつ効率的にすることです。第 3 段階は、コンピューターの応用範囲を広げることであり、開発の焦点は離散数学から確率と統計へと移ります。私はホップクロフト氏と何度か話をしましたが、彼は機械学習が今日のコンピュータサイエンスの発展の中核であると信じています。彼は機械学習とディープラーニングに関する本を読んでおり、学部生に機械学習のコースを教えることを計画しています。

コンピューター業界では、機械学習があらゆる場所で使用されていることから、今では冗談めかして機械学習を「万能分野」と呼んでいます。機械学習には、独自の規律システムに加えて、2 つの重要な放射機能もあります。まず、応用分野の問題を解決するための方法とアプローチを提供します。応用分野としての機械学習の目的は、難しい数学を疑似コードに変換し、エンジニアがプログラムを作成できるようにすることです。次に、統計学、理論計算機科学、オペレーションズ・リサーチ、最適化などの伝統的な分野における新たな研究課題を見つけます。そのため、世界的に有名な大学のコンピュータサイエンス学部のほとんどは、機械学習または人工知能を中核分野として挙げ、機械学習分野の学部の規模を拡大し、競争力の高い機械学習の研究分野を少なくとも 2 つまたは 3 つ維持しています。コンピュータサイエンス専攻の中には、大学院生の 3 分の 1 または半数が機械学習や人工知能のコースを受講することを選択するところもあります。

機械学習は現在、統計学の主流の方向となっています。多くの有名大学の統計学部は、機械学習の分野から教授を採用しています。たとえば、スタンフォード大学統計学部の新しい助教授 2 名は、機械学習の分野出身です。統計分野ではコンピューティングがますます重要になっています。従来の多変量統計解析では行列分解を計算ツールとして使用し、現代の高次元統計では最適化を計算ツールとして使用します。

機械学習の発展から得たインスピレーション

機械学習の開発の歴史は、分野の発展には実用的な姿勢が必要であることを示しています。流行の概念や名前は、学問分野の普及を促進する上で間違いなく一定の役割を果たしますが、学問分野の本質は、依然として、研究課題、方法、技術、それを支える基盤、そして社会に生み出す価値です。

「機械学習」はかっこいい名前です。簡単に言えば、その目的は機械が人間のように学習できるようにすることです。しかし、10年間の発展の黄金期に、機械学習コミュニティは「知能」や「認知」を過度に宣伝することはありませんでした。その代わりに、統計やその他の方法を導入してこの分野の理論的基礎を確立することに重点を置き、データ分析と処理に方向転換しました。教師なし学習と教師あり学習を2つの主要な研究課題として、一連のモデル、方法、計算アルゴリズムを提案および開発し、業界が直面するいくつかの実際的な問題を効果的に解決しました。近年、ビッグデータとコンピューティング能力の驚異的な向上により、機械学習の基盤となるアーキテクチャが数多く開発されてきました。ニューラル ネットワークは、実際には 1980 年代後半または 1990 年代前半に広く研究されていましたが、その後忘れ去られてしまいました。近年、ディープラーニングに基づくニューラルネットワークの台頭により、業界に大きな変化とチャンスがもたらされています。ディープラーニングの成功は、脳科学や認知科学の進歩によるものではなく、ビッグデータと計算能力の大幅な向上によって推進されています。

機械学習の発展は、学際的な国境を越えた研究の重要性と必要性​​を示しています。しかし、このような交差点では、単にいくつかの名詞や概念を知っているだけでは不十分で、真の統合が必要です。統計学者フリードマンは、若い頃は物理学の研究に従事していました。彼は最適化アルゴリズムの達人であり、プログラミングスキルも同様に素晴らしいです。ジョーダン教授は著名なコンピューター科学者であり、また著名な統計学者でもあり、心理学の博士号も取得しているため、統計的機械学習を確立する責任を担うのに適した立場にあります。ヒントン教授は世界的に有名な認知心理学者であり、コンピューター科学者です。彼は早くから大きな成功を収め、学界で有名になりましたが、その後も第一線で活躍し、独自のコードを書き続けました。彼のアイデアの多くはシンプルで実現可能かつ非常に効果的であり、彼は偉大な思想家として知られています。ディープラーニング技術が革命的な進歩をもたらしたのも、まさに彼の知恵と実践的な経験があったからです。これらの学者は非常に実用的であり、空虚な概念や枠組みについては決して言及しません。具体的な問題、モデル、方法、アルゴリズムなどから始めてボトムアップのアプローチを採用し、段階的に体系化を実現します。

機械学習は、学界、産業界、起業家精神(または競争)などの共同の努力によって生み出されると言えます。学問はエンジンであり、産業は原動力であり、起業家精神は活力と未来です。学界と産業界はそれぞれ責任と役割分担を持つべきです。学術コミュニティの責任は、機械学習の分野を確立および発展させ、機械学習の分野で専門的な人材を育成することです。大規模なプロジェクトやエンジニアリング プロジェクトは市場によって推進され、業界によって実装および完了されるべきです。

私の国における機械学習の現状と将来

機械学習は我が国で広く注目され、一定の成果を上げていますが、ほとんどの研究はデータマイニングに焦点を当てており、純粋な機械学習研究に従事している学者は我が国にはほとんどいないと思います。コンピュータの学術界では、理論や手法などの基礎研究が十分に注目されておらず、強力な理論的背景を持つ分野が軽視されているケースさえあります。しかし、一部の「余剰分野」や「衰退分野」が大量の人材と資金を集めており、我が国は国際主流のコンピュータ分野で競争力と影響力を欠いている。

統計学は我が国ではまだ弱い科目であり、つい最近になってようやく国によって第一レベルの科目として指定されました。私の国では、統計学は両極端です。1つは、統計学が数学の一分野としてみなされ、主に確率論、ランダムプロセス、数理統計理論を研究するということです。第二に、経済学の一分野として分類され、経済分析への応用に重点が置かれています。しかし、機械学習は統計コミュニティではあまり注目されていません。統計学とコンピューターサイエンスは、ワッサーマン氏が言うところの「別々の世界」にまだ存在しています。

私の国のコンピュータサイエンスのトレーニングシステムは、基本的にはまだ開発の初期段階にあります。今日の学生は子供の頃からコンピュータに触れており、彼らのプログラミング能力は外国の学生に劣っていません。しかし、理論的知識が十分に考慮されておらず、統計の重要性が十分に認識されていないため、学生の数学的能力は海外の有名大学に比べて大きく遅れをとっています。私の国の大学のコンピュータサイエンス専攻のほとんどは、学部生向けに人工知能コース、大学院生向けに機械学習コースを提供していますが、深さ、幅、知識構造が学問分野の発展に遅れをとっており、時代のニーズを満たすことができません。そのため、人材育成の質と量が業界の緊急のニーズを満たすことができません。

現在、データサイエンスの専攻はわが国で大きな注目を集めています。その強力な統計力に頼って、北京大学、復旦大学、中国人民大学はデータサイエンス専攻やビッグデータ研究機関を設立し、学部生や大学院生の募集を始めています。しかし、現在、機械学習を専攻できる大学はありません。機械学習は他の応用分野や理論分野に波及効果をもたらし、両者をつなぐ役割も果たします。一方で、理論面の人材を確保し、他方では、医療データ、金融データ、画像・動画データなど、さまざまな分野の問題を組み合わせて、応用面の人材を提供することができます。したがって、学部レベルのコンピュータサイエンス プログラムに機械学習のトレーニングを追加する必要があると考えています。

機械学習はテクノロジー、科学、芸術を組み合わせたもので、従来の人工知能とは異なり、現代の人工知能の中核をなしています。統計、最適化、行列解析、理論計算機、プログラミング、分散コンピューティングなどが含まれます。したがって、既存のコンピュータサイエンスの学部コースに基づいて、確率、統計、行列解析のコースを適切に強化することが推奨されます。具体的なコース設定と関連教科書の提案は次のとおりです。

1. 確率と統計の基礎コースを強化するには、Morris H. DeGroot と Mark J. Schervish が共著した「Probability and Statistics」第 4 版を教科書として使用することをお勧めします。

2. 線形代数コースでは行列解析の内容を強化します。推奨される教科書は、ギルバート・ストラングの『線形代数入門』です。ギルバート・ストロングは MIT で線形代数を教えており、彼のオンライン ビデオ コースは古典的です。将来的には、Trefethen N. Lloyd と David Bau lll による「Numerical Linear Algebra」を教科書として、行列計算コースを開設することをお勧めします。

3. 機械学習コースを提供します。機械学習に関する古典的な本は数多くありますが、そのほとんどは学部生の教科書としては適していません。最近では、MIT が発行した John D. Kelleher と Brian Mac Namee らの共著『Fundamentals of Machine Learning for Predictive Data Analytics』、または Andrew R. Webb と Keith D. Copsey の共著による『Statistical Pattern Recognition』第 3 版のほうが、学部生向けの教科書としてより適しています。また、学生が機械学習の手法を特定の問題に適用できるように、コースに実践的なセッションを含めることも推奨されます。

さらに、学部のコンピューター専攻の学生向けに、上級コースまたは優等コースとして以下のコースを設けることをお勧めします。特に、国内の大学ではコンピュータサイエンス分野のトップタレント育成プログラムを設けているところもあります。このプログラムの育成計画に以下のコースを組み込むことが考えられると思います。実際、上海交通大学の ACM クラスでは、ランダム化アルゴリズムや統計的機械学習などのコースが提供されています。

1. 数値最適化コースについては、Jorge Nocedal と Stephen J. Wright による「Numerical Optimization」第 2 版を参照することをお勧めします。数値解析については、Timothy Saul による「Numerical Analysis」を教科書として使用することをお勧めします。

2. アルゴリズム コースを強化し、ランダム化アルゴリズムなどの高度なアルゴリズムを追加します。参考となる教科書は、Michael Mitzenmacher と Eli Upfal による「Probability and Computing: Randomized Algorithms and Probabilistic Analysis」です。

3. プログラム設計の面では、並列コンピューティングの内容を追加または強化します。特にディープラーニング技術の実行では、GPU アクセラレーションが通常必要になります。David B. Kirk と Wen-mei W. Hwu による教科書「Programming Massively Parallel Processors: A Hands-on Approach, Second Edition」を使用できます。また、Udacity の CUDA コンピューティングに関する Nvidia の公開クラスを参照することもできます。

結論として、コンピューターサイエンスを主な焦点とし、統計学や応用数学と組み合わせた機械学習の大学院プログラムを開設することを検討する価値があると思います。大学院専攻では、理論的機械学習、確率およびランダムグラフモデル、ベイズ法、大規模最適化アルゴリズム、ディープラーニングなどの基本的な機械学習分野に重点を置く必要があります。理論的機械学習、確率的グラフィカルモデル、統計的推論とベイズ解析、凸解析と最適化、強化学習、情報理論などのコースを提供することが推奨される[1〜8]。

私の国における人工知能の発展の根本的な解決策は教育にあります。しっかりとした数学と科学の基礎、強力な実践的実行能力、そして真に統合された学際的な能力と国際的なビジョンを備えた才能ある人材を育成することによってのみ、私たちは偉大なことを達成することができます。

謝辞:

この記事は、統計首都Weiboに掲載された記事「機械学習:統計とコンピューティングへの愛」の要約版と修正版に基づいて編集されています。具体的には、原文の後半部分が削除され、「我が国における機械学習の現状と今後の展開」というセクションが追加されました。元の記事は、Statistics City に掲載された後、多くの反響をいただきました。 Chang Xiangyu博士と私の学生であるChen Di、Chen Zihao、Li Yujun、Luo Luo、Ye Haishan、Zhao Shenjianらは、改訂された原稿に対して建設的なコメントを提供してくれました。ここで皆様に感謝申し上げます。

著者:

[[188094]]

張志華は北京大学確率統計学部の教授です。彼は浙江大学と上海交通大学のコンピュータサイエンス学部で教鞭をとってきました。主に機械学習と応用統計学の分野で教育と科学研究に従事。メール:

<<:  Baiduの新しい論文はGram-CTCを提案:単一システムの音声転写が最高レベルに到達

>>:  機械学習研究動向の分析: TensorFlow が Caffe を上回り、最も一般的に使用される研究フレームワークに

推薦する

顔認証がまたもや放棄される。米国に続いて今度はEUの番

近年、人工知能の継続的な台頭により、顔認識が広く使用されるようになり、「顔スキャン」の時代が静かに到...

2023年の生成AIの包括的なレビュー

2023年には、生成AIが開発者のアプリケーション構築支援において飛躍的な進歩を遂げ、大手ツールベン...

ChatGPT がリリースされてから 1 年が経ちました。主要なオープン ソース モデルはすべて追いついたのでしょうか?

1年前の今日、ChatGPTが誕生し、人工知能の新しい時代が到来したように思えました。 ChatG...

機械学習における勾配降下法

最大化問題は、機械学習アルゴリズムの非常に重要な部分です。ほぼすべての機械学習アルゴリズムの中核は、...

大手銀行はなぜ従業員にプログラミングの学習を求めるのでしょうか?あなたもその一人かもしれません

[51CTO.com 速訳] 海外の主要メディアであるフィナンシャル・タイムズとウォール・ストリート...

...

研究により、ディープラーニングAIは乳がんリスクの予測に優れていることが判明

放射線学誌に掲載された新しい研究によると、ディープラーニングと呼ばれる高度な人工知能は、一般的に使用...

メタバースの開発にはどのような重要な技術が必要ですか?

メタバースは、信頼できる資産価値とアイデンティティ認証を備えた仮想アクティビティを実行するためのプラ...

アリババのダブル11は記録破りであるだけでなく、AIショーでもある

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

OpenAIの内部抗争による被害はまだまだ終わっていない

OpenAI の最近の論争を受けて、AI エンジニアや企業はその API への依存を減らしたり、完全...

機械学習はデータセキュリティに対する新たな脅威や裏口となるのでしょうか?

機械学習アルゴリズムは重要なサイバーセキュリティ技術となり、現在は主にマルウェアの特定、セキュリティ...

...

ダブル11プロモーション?貪欲アルゴリズムを使用して解決してください。

[[351760]]この記事はWeChatの公開アカウント「Java Chinese Commun...

人工知能がビジネスに進出

人工知能は、時間の経過とともに改良を続け、世界中の人々から賞賛されてきた、人間の設計の驚異です。 T...