12以上の学習リソースを検討した後、このAI学習パスをまとめました。

[[276295]]

タグ: AI、機械学習、ディープラーニング

一言でまとめると、AI の分野に参入したいのであれば、多くのことを学ぶ必要があります。複雑な知識の中から、回り道を避けて合理的な学習パスを見つけることができれば素晴らしいでしょう。この記事では、そのパスを見つけようとします。

1 はじめに

AI分野に進みたいプログラマーとして、インターネットで人工知能について調べたところ、AI開発、機械学習、Tensorflow、Pythonなど多くの知識が出てきたのですが、何を学ぶ必要があるのか、どのように学べばいいのか、まだ明確な答えがありません。あなたは大学の教師で、AI コースを教えなければならないと想像してみてください。学生が知識を習得できるように、コースを合理的かつ効率的に設定するにはどうすればよいでしょうか?私は学習方法と学習リソースに関する 10 以上の記事を読み、数十の関連コンテンツを閲覧し、リソースを統合して、比較的完全な学習パスを整理しました。このまとめを通して、皆さんがAI分野に参入するための明確な学習目標を持ち、学習内容を理解するとともに、この道筋に基づいて自分自身の学習計画を立てられるようになることを願っています。一方で、計画通りにAIの知識を学ぼうというモチベーションにもなります。

この記事を通じて、以下の AI 学習パスを学習でき、対応する参考学習資料も提供されます。

新しいスキルを習得するための方法論
AI人文科学の普及
基礎
プログラミング言語
機械学習
知識を深めるための基礎プロジェクト実習
ディープラーニング
高度なプロジェクトまたは論文

2 方法論

新しいスキルや知識を学ぶ場合、学習方法は非常に重要です。適切な学習方法は回り道を避けるのに役立ちます。まず、学習する前に 2 つの質問を明確にする必要があります。それは何でしょうか?どうやって学ぶの？これら 3 つの質問は、学習目標と学習計画として要約できます。学習目標は非常に明確で、AI の分野に足を踏み入れ、AI 関連の仕事に従事することです。学習計画とは、学習内容とプロセスの設計と実装であり、この記事ではこれについて説明します。もう 1 つは、学習に対する自信を築くことです。学習は簡単ではありません。機械学習を例に挙げてみましょう。学習プロセスでは、多数の複雑な数式に直面することになります。実際のプロジェクトでは、データ不足や難しいパラメータ調整に直面することになります。適切な学習方法を開発すれば、学習は可能です。

学習目標と計画を明確にした後、学習の実施レベルでは、実践を重視し、興味を第一に考え、実践と学習を組み合わせる必要があります。ここで言及する価値があるのは、ファインマン技法を使って教えたり学んだりすることは、学習の良い方法であるということです。簡単に言えば、ファインマンテクニックとは、何かを他の人に明確に説明することで、自分が理解したことを確認することです。それは4つのステップに分かれています:

1) 目標を選択する: 目標を明確にし、コンセプトを選択する

2) 指導: 概念と関連知識を学び、それを子供にどのように説明するかを想像します。実際の講義であればもっと良いでしょう。

3) 間違いを訂正し、さらに学習する: 指導の過程で不明な点はありますか? もしあれば、さらに学習して理解を深めてください。

4) 類推を単純化する: 実際の事例と関連付けて、自分の言葉で概念を簡潔に説明する

ファインマン法に従って新しいスキルを学び、より早く習得し、より深く記憶します。この方法は、IT 分野のスキルを学習するのに非常に適しています。

3. 人工知能の普及

3.1 AI人文科学史

まず、この分野を理解し、包括的なビジョンを確立し、十分な興味を育んでください。 AIはどのように発展してきたのか？なぜ近年になってようやく人気の研究分野となったのか？AI技術にはどのような技術的方向性があるのか？その応用分野は何か？将来的にどのように発展していくのか？その展望は何か？社会にどのような影響を与えるのか？これらの疑問を理解することで、AIの過去と現在を理解し、AIに対する印象を深め、AIへの興味を強め、さらにはAIに関する想像力を活用して、その後のAI学習について独自のアイデアを持つことができます。 AIの開発と普及に関しては、以下の情報が参考になります。

著書「知性の時代」呉俊
書籍、「インテリジェント革命」、ロビン・リー
書籍、人工知能、テンセント研究所
本、人工知能の簡潔な歴史、ニック
書籍: ジェリカ・プラン著「人工知能の時代」および「人工知能について誰もが知っておくべきこと」
書籍「究極の科学：人工知能について語る」Jizhi Club
書籍: 「Technology at its Peak」および「Technology at its Peak 2」、MIT Technology Review
機械学習から始まるブログ:
https://www.cnblogs.com/subconscious/p/4107357.html

3.2 現在のAI開発とレイアウト

人工知能について学びたいなら、まず国内のインターネット大手の現在の AI レイアウトを見てみるべきです。そうすれば、AI の現在のトレンドがどこにあるのか、どのような重要なアプリケーションがあるのか、どのような主要なテクノロジーがあるのか、大まかなアイデアが得られるでしょう。各大手企業には、AI プラットフォームの公式 Web サイトがあります。主要な AI オープンプラットフォームの一覧は次のとおりです。

https://blog.csdn.net/qq_15071263/article/details/82908201

主要な AI プラットフォームへのリンクを確認できます。さまざまなインターネット企業における AI の現在のレイアウトを理解するだけでなく、これらの企業の AI 職の募集要件や、主要な求人 Web サイトにおけるこの職の現在の要件にも注目してください。これには 2 つの利点があります。1 つは、自分の学習の方向性を明確にし、学習に集中できることです。もう 1 つは、自分の学習に対して一定の心理的期待を持ち、この職に就くチャンスを得るためにどの程度学習する必要があるかを知ることです。以下は、Boss Zhipin に掲載されている自然言語処理関連の求人です。

数学的基礎、データ処理、自然言語処理、機械学習、データマイニングなどの技術が比較的重要であり、学習の焦点でもあることがわかります。

主要AI企業の現状の配置については、参考資料として以下が挙げられます。

記事、主要な AI オープンプラットフォームの一覧:
https://blog.csdn.net/qq_15071263/article/details/82908201
ウェブサイト、Baidu Brain: https://ai.baidu.com/
ウェブサイト、Tencent AI オープンプラットフォーム: https://ai.qq.com/
ウェブサイト、Alibaba Damo Academy: https://damo.alibaba.com/
記事：自動運転、金融、小売…BAT間のAI戦争はどこへ向かうのか？
https://www.huxiu.com/article/230094.html
書籍「人工知能標準化白書 2018」：
http://www.cesi.ac.cn/201801/3545.html
書籍「人工知能開発に関する白書 - 技術アーキテクチャ（2018）」：
http://www.caict.ac.cn/kxyj/qwfb/bps/201809/t20180906_184679.htm
書籍「人工知能開発白書産業応用（2018）」：
http://www.caict.ac.cn/kxyj/qwfb/bps/201812/t20181227_191672.htm
書籍「中国情報通信科学院関連白書」：
http://www.caict.ac.cn/kxyj/qwfb/bps/

3.3 AIアーキテクチャとジョブ選択

3.3.1 AIアーキテクチャの観点

ビジネスの観点から見ると、人工知能は、知覚、認知、サービス機能の 3 つのレベルと、次の 2 つの主要な応用方向に分けられます。

人工知能技術の観点から見ると、インフラストラクチャ層、テクノロジー層、アプリケーション層に分けられます。次のように：

3.3.2 AIによる仕事の選択

上記の2つの図から、AI技術の分野と全体的なアーキテクチャを基本的に理解できます。現在のインターネット大手の配置と組み合わせると、将来的には、インフラストラクチャとテクノロジ層は基本的に大企業によって制御および配置され、開発と詳細な開発の余地が比較的少なくなることがわかります。個人がこれらの研究開発に参加したい場合は、基礎となるテクノロジーとアルゴリズムから始める必要があり、非常に要求が厳しいです。アプリケーション層では、さらなる発展の余地があります。AI AI+行业、または行业+AIモデルを活用し、既存のAIインフラとAI技術を組み合わせることで、より多くのアプリケーションを作成できます。これは個人の成長の機会であると同時に、起業家精神のある企業にとってもチャンスです。

記事「Tencent Cloud Director が AI エンジニアになる方法を段階的に教えてくれます」:

https://cloud.tencent.com/developer/article/1004751

AIエンジニアは垂直分野によって分類されており、音声認識、画像視覚、パーソナライズされた推奨などのビジネス分野のAIエンジニアがいます。研究開発内容によると、

1) AIアルゴリズム研究

これらの人々のほとんどは博士号を取得しており、学校で優れた理論的および数学的基礎を蓄積しており、最新の学術成果を素早く理解して吸収することができます。ここでの理論とは、音声処理やコンピュータービジョンなどの専門知識を指します。 AI アルゴリズムを研究する人は、主にサンプルの特性、モデルの設計と最適化、モデルのトレーニングに焦点を当てています。サンプル特性とは、与えられたデータからサンプルを構築し、サンプルの特性を定義する方法を指し、パーソナライズされた推奨の分野では非常に重要です。モデル設計と最適化とは、新しいネットワークモデルを設計したり、既存のモデルを反復的に最適化したりすることを指します。たとえば、CNNネットワークモデルでは、AlexNet、GoogleNet v1/v2/v3、ResNetなどの新しいモデルが次々と登場しています。また、モデルプルーニングにより、計算精度を5%犠牲にして計算量を80%削減し、モバイル端末でのエッジコンピューティングを実現できます。モデルトレーニングとは、ネットワークをトレーニングし、過剰適合を防ぎ、高速収束を達成する方法を指します。

2) AIエンジニアリングの実装

このタイプの人々は主に、モデルのトレーニングと予測を容易にするためのコンピューティングロジックとハードウェアパッケージを提供します。たとえば、次のようになります。 - Caffee/TensorFlow などのトレーニングフレームワークのソースコードに精通し、それらを巧みに使用してターゲットを絞った最適化を行うことができる。 - 機械学習プラットフォームを構築して使用しきい値を下げ、ページ操作を通じてサンプルとモデルを提供してトレーニングを開始する。 - FPGA を介してハードウェアアクセラレーションを実装し、レイテンシとコストを抑えたモデル予測を実現する。 - 新しいモデルが検証された後、スムーズなオンラインモデル切り替えを実現する。

3) AIアプリケーション

優れたモデル、一般的な音声認識、画像ビジョン、パーソナライズされた推奨事項のビジネスアプリケーションの検証に重点を置きます。もちろん、これには、端末ネットワークの伝送帯域幅の予測、画像トランスコーディングにおけるパラメータの予測など、ビジネスシナリオと組み合わせたより多くのアプリケーションも含まれます。

まとめると、ポジションと方向性を選択する際には、数学とアルゴリズムの基礎がしっかりしていない限り、始めやすく、開発の機会も大きい AI アプリケーションレベルから選択することをお勧めします。

この章の参考文献:

記事「知識グラフを体系的に学ぶ方法」
https://blog.csdn.net/hadoopdevelop/article/details/79455758
記事では、Tencent Cloud Director が AI エンジニアになる方法を段階的に教えてくれます。
https://cloud.tencent.com/developer/article/1004751

4つの基本

人工知能を学ぶにはアルゴリズムを学ぶ必要があり、アルゴリズムを学ぶには数学的な基礎が必要です。具体的な計算過程では行列計算が必要になることが多いため、線形代数の知識も必要になります。データの分類と分析には確率と統計も必要です。多くの場合、人工知能は最適化問題を追求する。例えば、BPニューラルネットワークで使用される重みは反復的に変化し、現在の重み値と最適値の間の距離を計算する関数は損失関数と呼ばれる。反復プロセス中に、関数は微分され、値を増やすか減らすかを決定します。微分によって得られた関数が勾配であり、反復プロセスは勾配降下法と呼ばれます。このプロセスでは、微積分の知識も不可欠です。学習の過程では、原理を理解するために読む必要のある論文や英語の資料を参照する必要のある論文に遭遇することが多いため、英語の知識も必要になります。まとめると、次の基本的な知識が必要です。

線形代数: スカラー、ベクトル、行列/テンソルの乗算、反転、特異値分解/固有値分解、行列式、ノルムなど。
確率と統計: ベイズ、期待値と分散、共分散、確率分布 (0-1 分布、二項分布、ガウス分布)、独立性とベイズ、最大尤度と最大事後推定など。
高度な数学: 微積分、連鎖律、行列微分、線形最適化、非線形最適化 (凸最適化/非凸最適化) およびその派生法 (勾配降下法、ニュートン法など)。
英語: オンライン英語辞書を常に持っていて、英語の情報ページを簡単に読むことができるようにしましょう

以下に参考資料を示します。

著書「線形代数はこうやって学ぶべきだ」シェルドン・アクラー
書籍：確率論と数理統計学、陳希如
書籍：新数理解析講義（全3巻）、張珠生
本、みんなのための統計学、ドーン・グリフィス
書籍、統計的学習法、李航
書籍「行列分析と応用」張仙達
記事「機械学習理論パート 1: 機械学習の数学的基礎」:
https://zhuanlan.zhihu.com/p/25197792

5. プログラミング言語

現在の人工知能開発で最もよく使われている言語はpythonです。もちろん、 java 、 c++ 、 matlab 、 Rなど、他の言語も数多くあります。最初に学習を始めるときは、 pythonを選択してください。プログラミング言語を学ぶ場合、大切なのはただ一つ、「練習」です。コンピュータ上で直接操作し、学習は主に Python の基礎 (文法、関数、配列、クラスなど)、Python でよく使用されるライブラリ、Python 機械学習ライブラリなど、いくつかのモジュールに分かれています。以下に、参考になるpyhton学習教材をいくつか示します。

チュートリアル、「Liao Xuefeng Python チュートリアル」:
https://www.liaoxuefeng.com/wiki/1016959663602400
チュートリアル「Python 100 の例」:
https://www.runoob.com/python/python-100-examples.html
記事「Python クローラーをゼロから作成する」:
https://zhuanlan.zhihu.com/p/26673214
ビデオ「ゼロから Python を学ぶ」:
https://www.bilibili.com/video/av4050443

6 機械学習の知識

6.1 機械学習アルゴリズム

現在の人工知能技術では機械学習が主導的な役割を果たしているが、機械学習だけが含まれるわけではなく、ディープラーニングは機械学習のサブ項目であることを明確にする必要があります。現在、AIを学ぶことは主に機械学習を学ぶことであると言えますが、人工知能は機械学習と同じではありません。機械学習プロセスに特有のものとしては、データの収集、クリーニング、前処理、モデルの構築、パラメータの調整、モデルの評価などがあります。基礎となるのは、回帰アルゴリズム、決定木、ランダムフォレストとブースティングアルゴリズム、SVM、クラスタリングアルゴリズム、EMアルゴリズム、ベイズアルゴリズム、隠れマルコフモデル、LDAトピックモデルなどを含む機械学習の基本的なアルゴリズムです。インターネット上にはすでに機械学習のチュートリアルが多数存在しており、学習が非常に便利です。検索エンジンで簡単に検索するだけで、機械学習に関する記事が多数見つかります。それを忠実に守り、その後の実践と組み合わせれば、学習に問題はないはずです。以下に参考資料を示します。

書籍「機械学習の実践」ピーター・ハリントン
書籍『機械学習』、Zhihua Zhou 著
書籍、機械学習入門、Ethen Alpaydin
書籍：「機械学習の基礎：入門から就職まで」胡煥武著
本、データの美しさ、ウー・ジュン
ビデオ「機械学習」(Andrew Ng 著):
https://www.coursera.org/learn/machine-learning
ビデオ「Li Hongyi Machine Learning 2017」Li Hongyi: http://t.cn/RpO3VJC
記事、機械学習:
https://github.com/JustFollowUs/Machine-Learning

6.2 機械学習フレームワーク

機械学習のアルゴリズムを理解するには、それを実装するための特定のツールも必要です。幸いなことに、Tensorflow、Keras、Theano、matlab など、現在利用できるツールは数多くあります。現在、Tensoflow は機械学習の一般的なフレームワークであり、これを詳しく学習して始めることができます。参考文献はこちら

書籍「TensorFlow in Action」、Huang Wenjian
書籍「Tensorflow: 実践的な Google ディープラーニングフレームワーク」、Zheng Zeyu
ビデオ「Tensorflow チュートリアル」は、 http://t.cn/RTuDxFTでご覧いただけます。

6.3 データセットの選択

「料理が上手な人も、米がなければ料理はできない。」機械学習を使ってプロジェクトの実践を行う際、データがなければモデルのトレーニングはおろか、したがって、テスト用のデータセットを入手することも重要なツールです。幸いなことに、オンラインで利用できるデータセットは多数あります。参考文献は次のとおりです。

手書き数字ライブラリ MNIST: http://yann.lecun.com/exdb/mnist
画像処理データCOCO: http://mscoco.org
機械学習のための古典的なオープンソースデータセット: https://www.jianshu.com/p/83ebd261862a
機械学習データセットの入手先: https://www.jianshu.com/p/abce3d177e45

7 主なプロジェクト実践

実践を通して学び、いくつかの小さな例を使用して機能を実装し、機械学習を使用して実際の問題を解決します（画像分野、犬の認識、花の認識など）。機械学習の方法をブラックボックスとして扱い、画像（コンピュータービジョン）、オーディオ（音声認識）、テキスト（自然言語処理）のいずれのアプリケーション方向でも選択します。オープンソースプロジェクトが多数ある画像分野を選択することをお勧めします。 GitHub にアクセスして、参照用の関連するオープンソースプロジェクトを見つけることもできます。

8 ディープラーニングの知識

ディープラーニングは機械学習のサブ項目です。人工ニューラルネットワークの研究から生まれました。複数の隠れ層を持つ多層パーセプトロンはディープラーニング構造です。学習プロセスでは、ディープラーニングの概念を理解し、BP ニューラルネットワーク、CNN 畳み込みニューラルネットワーク、RNN リカレントニューラルネットワークなどの原理とアプリケーションに精通している必要があります。以下に参考資料を示します。

書籍、Python によるコンピュータービジョンのディープラーニング、Adrian Rosebrock
書籍「Tensorflow: 実践的な Google ディープラーニングフレームワーク」、Zheng Zeyu
書籍: ディープラーニング、イアン・グッドフェロー
本: Python によるディープラーニング (François Cholet 著)
書籍、ディープラーニングとコンピュータービジョン、Ye Yun
ビデオ、Andrew Ng によるディープラーニング:
https://www.bilibili.com/video/av49445369
ビデオ「スタンフォード CS231N 2017」フェイフェイ・リー: http://t.cn/RTueAct
ビデオ「1 日でディープラーニングを理解する」Li Hongyi 著: http://t.cn/RTukvY6
ビデオ「Li Hongyi Deep Learning 2017」: http://t.cn/RpO3VJK
ビデオ、Tensorflow を使用したディープラーニング: http://t.cn/RTuDcjC

9 シニアプロジェクトまたは論文

強力な知識の蓄えがあれば、より困難な実際の戦闘に参加することができます。選択肢は 2 つあります。業界関係者は、オープンソースプロジェクトを見て、コードを変更する目的でコードを読むことができます。学術界関係者は、特定の分野の論文を読んで、問題を解決するための論文を発表することができます。または、 kaggleコンテストに参加して問題を検証し解決することもできます。この段階では、個人の練習に依存します。しかし、現段階で、当初の学習計画を振り返ると、基本的には目標を達成したと言えます。最後に、論文検索については、物理学、数学、コンピューターサイエンス、生物学の論文のプレプリントを収集する Web サイトである arXiv について触れておく必要があります。事前収録としてドラフトを arxiv にアップロードすると、論文が収録される前に他の人にアイデアが盗用されるのを防ぐことができます。そのため、arXiv は論文の独創性（アップロードタイムスタンプ）を証明できる文書収集サイトです。今日、多くの科学者は、論文を専門の学術雑誌に投稿する前に、arXiv.org にアップロードすることに慣れています。使用できるツールは 2 つあります。

arXiv公式サイト: https://arxiv.org
Arxiv 論文クエリ: http://www.arxiv-sanity.com
コード付き論文: https://paperswithcode.com

要約する

人工知能の学習方法と学習リソースに関する10以上の記事を検索して読んだ後、この記事ではこれらのリソースを統合し、比較的完全な学習パスを整理しようとします。各段階で対応する参考資料が提供されます。資料があれば、学習と実践がより重要になります。自分の学習に明確な計画を立てたいと考えています。また、AI分野に進みたい学生にも役立ちたいと思っています。

<<: AI プロジェクトの 85% が失敗する理由は何ですか?

>>: 2019 年の機械学習に関するトップ 10 の Q&A: 面接で知っておくべきこと