誰もが教室でデータサイエンス、人工知能、機械学習を学ぶ時間があるわけではありませんし、誰もがこれらの分野を学ぶために必要な正式な教育を受ける余裕があるわけではありません。それで私たちは何をすべきでしょうか?ソフトウェア開発者であり機械学習エンジニアでもある Jerry Buaba が独学コースを提供しています。 データサイエンス、人工知能、機械学習を学ぼうとするときに人々が直面する最大の障害は、時間とお金です。独学は十分な自己規律、勤勉さ、集中力を必要とする芸術です。適切に使用すれば、勉強と仕事を柔軟に組み合わせることができます。 ただし、データサイエンス、人工知能、機械学習を独学で学ぶ最初の段階は大変かもしれませんが、それだけの価値はあります。独学で良い進歩を遂げる鍵は、自分のペースで勉強することです。 この記事では、データ サイエンス、人工知能、機械学習を独学で学ぶ際の道筋を紹介し、新しいことを学ぶ上での進歩を助けます。 数学を学ぶ 数学を学ぶのは面倒に聞こえるかもしれませんが、この分野では必要です。この記事の読者は高校で初級数学と上級数学の知識を学んでいるはずです。これは良いスタートですが、データサイエンス、人工知能、機械学習の分野では十分ではありません。統計、代数、その他の数学の概念をより深く学ぶ必要があります。 基本的な数学知識に関するリソースのリストについては、https://towardsdatascience.com/mathematics-for-data-science-e53939ee8306 を参照してください。 コーディングを学ぶ 初心者は、いきなり機械学習コードの書き方を学ばず、まずは一般的なプログラミングの基本概念を学びましょう。まず、プログラミングとは何か、既存のプログラミング言語の種類、コードを正しく記述する方法などを理解します。これらは、一生忘れられない重要な概念をたくさん学ぶことになるので、非常に重要です。 したがって、このステップをゆっくりと進め、高度なことを急いで学ばないでください。このプロセスにおける理解の深さが、この業界でのあなたのパフォーマンスを決定します。 このビデオはプログラミングとコンピュータ サイエンスの入門であり、コンピュータ サイエンスとプログラミングの重要な概念を理解するのに役立ちます: https://www.youtube.com/watch?v=zOjov-2OZ0E。 プログラミング言語の熟練度 データサイエンティスト、AI、機械学習エンジニアはさまざまな言語を使用しますが、最も一般的な言語はPython、R、Java、Julia、SQLです。もちろん、他にも多くのプログラミング言語が利用可能ですが、ここで挙げたものは、以下の理由から最も一般的に使用されている言語です。 これらの言語は比較的簡単に習得でき、十分な時間をかけて学習を続ければ、非常に早く上達することができます。 より少ないコードでより多くの機能を実現できます。 コミュニティとエコロジーは非常に充実しており、問題が発生した場合にはいつでもコミュニティが支援とサポートを提供できます。 データ サイエンティスト、AI、機械学習エンジニアが必要とするほぼすべてのライブラリとパッケージが揃っています。 オープンソースなので無料で使えます。 複数の言語を学ぶことは全く悪いことではありません。実際、それはとても良いことです。ただし、各プログラミング言語を学習するときは時間をかけて、複数の言語を同時に学習しないようにしてください。複数の言語を同時に学習すると、混乱してしばらく迷子になる可能性があります。 時間をかけて一度に 1 つの言語を学習し、キャリアに必要な部分だけを学習するようにしてください。 Python は比較的理解しやすいので、まずは Python を学ぶことをお勧めします。さらに、以下のリソースを順番に学習することをお勧めします。 https://www.youtube.com/watch?v=rfscVS0vtbw&t=5s https://www.youtube.com/watch?v=r-uOLxNrNk8 データの取得方法を学ぶ 通常、データは直接あなたに届くわけではなく、すぐに入手できない場合もありますが、とにかく使用できるデータを取得する方法を見つける必要があります。 あなたの職場には優れたデータ収集システムが導入されているかもしれません。そうであれば安心です。そうでない場合は、データを取得する方法を見つける必要があります。ただのデータではなく、目標を達成するために使用できる有効なデータを取得する必要があります。 データの取得はデータ マイニングと完全に同じではありません。データ マイニングのプロセスです。インターネット上の多くの場所で無料のオープンソース データを入手できますが、場合によっては Web サイトからデータをスクレイピングする必要があることもあります。 Web スクレイピングは非常に重要であり、キャリアの中で頻繁に使用する可能性があるため、誰もが Web スクレイピングを学習できることを願っています。 Web クローラーのチュートリアル: https://www.youtube.com/watch?v=0_VZ7NpVw1Y データはデータベースに保存されることがあるため、データ サイエンティスト、人工知能、機械学習エンジニアは、仕事でデータベースに直接接続して使用できるように、データベース管理についても少し知っておく必要があります。この段階では SQL の知識が非常に重要です。 SQL 学習リソース: https://www.youtube.com/watch?v=sTiWTx0ifaM&t=15s データの処理方法を学ぶ これはしばしば「データ ラングリング」と呼ばれます。このプロセスにはデータのクリーニングが含まれており、これはデータに対して探索的なデータ分析を実行し、データの不要な部分を削除することで実行できます。 データ ラングリング プロセスには、データを使用可能な形式に構造化することも含まれます。このフェーズは、データ サイエンス、AI、または機械学習プロジェクトの中で最も疲れる部分です。学習プロセス中に使用するサンプル データのほとんどはすでに前処理されていますが、実際のデータはまったく処理されていない可能性があります。この分野で成功したいと願う人は、現実世界のデータを探してそれを処理する必要があります。現実世界のデータはほとんどどこにでも見つかりますが、Kaggle は世界中の企業から現実世界のデータを入手できる素晴らしい場所です。 データの整理や処理は非常に疲れる作業ですが、継続的な献身と集中力があれば楽しい作業にもなります。 データ ラングリング関連のコース: https://www.youtube.com/watch?v=sz_dsktIjt4 データを視覚化する方法を学ぶ データ サイエンティスト、AI、または機械学習エンジニアであるからといって、職場やチームの全員がその分野の技術的な詳細を理解したり、生の形式のデータから推論したりできるわけではありません。そのため、データを視覚化する必要があります。 データの視覚化とは、一般的に、データ サイエンス、人工知能、機械学習の知識がなくても誰でも理解できるような形でチャートやグラフを使用してデータを提示することを指します。 データを視覚化する方法はたくさんあります。プログラマーとしては、データを視覚化するためのコードを書くことが、高速かつコストがかからないため、好ましい方法であるはずです。データを視覚化するためのコードの記述は、使用するプログラミング言語によって提供される多くの無料のオープンソース ライブラリを通じて行うことができます。 Matplotlib、Seaborn、Bokeh はすべて、データを視覚化するために使用できる Python ライブラリです。 Matplotlib データ視覚化チュートリアル: https://www.youtube.com/watch?v=yZTBMMdPOww データを視覚化する別の方法は、Tableau などのクローズドソース ツールを使用することです。よりエレガントで複雑な視覚化を作成するためのクローズドソース ツールは多数ありますが、費用がかかります。 Tableau は最も一般的に使用されているツールであり、私自身も頻繁に使用しているツールです。皆さんに Tableau の使い方を学ぶことをお勧めします。 Tableau チュートリアル: https://www.youtube.com/watch?v=aHaOIvR00So 人工知能と機械学習 人工知能と機械学習はどちらもデータによって駆動されるため、データ サイエンスのサブセットに似ています。これらは、適切に処理されたデータを機械やその他の無生物に提供することで、それらを人間のように動作させるプロセスを指します。機械は、段階的な指導とガイダンスを通じて、人間ができる多くのことを行うことができます。この文脈では、機械は、全く知識のない赤ん坊が徐々に物体を認識し、話し、間違いから学び、上達していく様子を想像することができます。同じ方法で、機械にこれらのことを行うように教えることができます。 人工知能と機械学習は、一般的に、さまざまな数学的アルゴリズムを通じて機械に力を与えることです。 AI と機械学習は進化を続ける分野であるため、その潜在能力はまだ完全にはわかっていません。しかし現在、AI と機械学習は、物体検出と認識、顔認識、音声認識と自然言語処理、詐欺やスパムの検出などの認知機能に広く使用されています。 AI と ML の一般的なアプリケーション: https://www.youtube.com/watch?v=5hNK7-N23eU 機械学習の詳細については、https://www.youtube.com/watch?v=GwIo3gDZCVQ&t=5s をご覧ください。 上記のビデオを視聴すると、初級および中級の機械学習の概要を把握し、利用可能な多くの機械学習アルゴリズム、その機能、および使用方法を理解できるようになります。これで、最初のシンプルな機械学習モデルを構築する準備が整いました。Victor Roman によるこの記事を参照してください: https://towardsdatascience.com/machine-learning-general-process-8f1b510bd8af。 独自の機械学習モデルをインターネット上で公開する方法を学びます 機械学習を通じてトレーニングされたモデルを展開し、インターネット上のすべてのユーザーが利用できるようにすることができます。これを行うには、モデルを公開するための Web ページまたは Web ページのセットを作成する必要があるため、Web 開発に関する十分な理解が必要です。 ウェブサイトのフロントエンドは、モデルを格納するバックエンドと通信する必要もあります。これを行うには、Web サイトのフロントエンドとバックエンド間の通信の問題を処理するための API を構築および統合する方法も知っておく必要があります。 パイプラインまたは Docker コンテナを介してクラウド サーバーに機械学習モデルをデプロイする予定の場合は、クラウド コンピューティングと運用について十分に理解しておく必要があります。機械学習モデルをデプロイする方法は多数ありますが、まずは Python Web フレームワーク Flask を使用して機械学習モデルをデプロイする方法を学ぶことをお勧めします。 チュートリアル: https://www.youtube.com/watch?v=UbCWoMf80PY マスターがあなたをドアに案内します 独学で学べるのは素晴らしいことですが、業界の専門家から直接学ぶことに勝るものはありません。現実の概念を研究することで獲得できる知識もあれば、直接体験することでしか学べない知識もあります。 メンターを持つことはあらゆる面で非常に役立ちますが、すべてのメンターがあなたのキャリアや人生に変化をもたらすことができるわけではないので、良いメンターを持つことは非常に重要です。 Notitia AI は、初心者から専門家レベルまで、データサイエンス、人工知能、機械学習をトレーニングするのに最適なプラットフォームです。このプラットフォームでは、あなたが選んだ専門分野で、個別かつ専門的な指導を提供する専任のメンターが割り当てられます。 コースを受講したり、オンライン リソースから学習するだけでは、真のデータ サイエンティスト、AI、機械学習エンジニアになれるわけではないことに注意してください。また、関連する認定資格を取得する必要があり、一部の仕事では学位が必要になります。時間をかけて勉強し、資格や学位を取得すれば、業界でのキャリアに備えることができます。 |
<<: ニューラル ネットワークはなぜ任意の関数を近似できるのでしょうか?
>>: 役に立たない、それとも翻訳ツール?日本が「会話」できるスマートマスクを発明
2021 年の最初の 3 か月間にロボット業界ではどのような新製品が登場しましたか? [[38857...
ITS114の統計によると、2019年のわが国のセキュリティとスノーブライトプロジェクトの数千万プ...
[[392342]] [51CTO.com クイック翻訳]探索的データ分析から自動機械学習 (Aut...
過去 10 年間で、機械学習への関心は爆発的に高まりました。ほぼ毎日、さまざまなコンピューターサイエ...
11月16日、海外メディアの報道によると、OpenAIのCEOであるサム・アルトマン氏は最近、Dev...
Google DeepMindは12月15日、「FunSearch」と呼ばれるモデルトレーニング方法...
人工知能はヘルスケアに変革をもたらす力となることが期待されています。では、医師と患者は AI 駆動型...
ここには Google が意図的に行ったジョークがあると思われます。周知のとおり、Google の柱...
仕事は私たちの生活の重要な部分です。私たちの人生の3分の1はこれに費やされています。私たちの世界には...
6月30日、瑞傑ネットワークス株式会社(以下、瑞傑ネットワークス)と合肥美的智能科技有限公司(以下...
利用できるアルゴリズムは多数あります。難しいのは、さまざまな種類の方法があり、それらの方法に拡張もあ...
[[256519]] 2019年1月現在の人工知能の現状は?最近の調査では、AI の人気、測定可能な...
[[424946]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...