この記事は公開アカウント「Reading Core Technique」(ID: AI_Discovery)から転載したものです。 多くの人が「データサイエンス」という言葉を聞くと、まず思い浮かぶのは「機械学習」です。私も同じでした。機械学習という概念に初めて出会ったとき、とても面白そうだったので、データサイエンスにとても興味を持つようになりました。そのため、データサイエンスを学ぶための入り口を探していたとき、私もそれに影響を受けました。
これが私が犯した最大の間違いであり、この記事の焦点です。データ サイエンティストになりたいのであれば、機械学習から始めないでください。 当然のことながら、「真に多才な」データ サイエンティストになるには、最終的には機械学習の概念を習得する必要があります。しかし、それなしでどれだけ遠くまで行けるかに驚かれるでしょう。機械学習から始めてみませんか? 1. 機械学習はデータサイエンスのほんの一部にすぎません。 データサイエンスと機械学習は、図に示す長方形と正方形のようなものです。機械学習はデータサイエンスの一部ですが、データサイエンスは必ずしも機械学習であるとは限りません。正方形は長方形の一種ですが、長方形は必ずしも正方形ではないのと同じです。実際には、機械学習モデリングはデータ サイエンティストの作業の 5 ~ 10% を占めるに過ぎず、残りの大部分の時間は他のことに費やされています。 すぐに機械学習に取り組むと、ほとんど利益を得られないのに多くの時間と労力を費やすことになります。 2. 機械学習を完全に理解したい場合は、まず他のいくつかの科目の基礎知識を習得する必要があります。 機械学習は本質的に、統計、数学、確率に基づいています。機械学習を学習する前に、まず基本的な理論的知識を習得し、しっかりとした理論的基礎を築く必要があります。例えば:
したがって、上記は 2 つのポイントにまとめることができます。1 つ目は、基礎を学ぶことで、より高度な内容を学習しやすくなること、2 つ目は、基礎を学ぶことで、複数の機械学習の概念を習得できることです。 3. 機械学習ですべてを解決できるわけではありません。 私を含め、多くのデータ サイエンティストがこれに苦労しています。私の最初の考えと一致して、ほとんどのデータ サイエンティストは、「データ サイエンス」と「機械学習」は互いに補完し合い、切り離せないものであると考えています。したがって、データ サイエンティストは、問題に直面するたびに、まず機械学習モデルを解決策として検討します。しかし、すべてのデータ サイエンスの問題に機械学習モデルが必要なわけではありません。 場合によっては、Excel や Pandas を使用した簡単な分析だけで問題を解決できることもあります。 場合によっては、問題が機械学習とはまったく関係がないこともあります。これらの問題を解決するには、スクリプトを使用したデータのクリーニングと操作、データ パイプラインの構築、インタラクティブなダッシュボードの作成のみが必要になる可能性があり、機械学習は必要ありません。 何をすべきでしょうか? 前述のように、基礎を学ぶことで、より高度なコンテンツに進み、複数の機械学習の概念を習得しやすくなります。統計、数学、プログラミングの基礎を学んでいると、「データ サイエンティスト」になるために何も進歩していないように感じるかもしれませんが、これらの基礎を学ぶことは将来の学習に間違いなく役立ちます。 今すぐ具体的な行動を開始したい場合は、次の手順を参照してください。
さらに、Pandas、NumPy、Scijit-learn などの Python ライブラリに精通していることも良い選択です。バイナリツリーは多くの高度な機械学習アルゴリズム (XGBoost など) の基礎となるため、バイナリツリーを学習することもお勧めします。
私の全体的なアドバイスとしては、機械学習に集中することはお勧めできません。なぜなら、a) 時間の有効な使い方ではないし、b) 職場で成功するデータ サイエンティストになる助けにもならないからです。ただし、これは非常に個人的な内容の記事ですので、自分の好きなように解釈し、自分にとって有益なものだけを取り上げてください。 |
<<: 開発から生産まで: 機械学習に関する 7 つの実践的な提案
>>: AIがあらゆるところに存在している世界を想像してみてください
人間関係を構築するのに優れているのは人間か人工知能か?実際、この革新的な技術は長い間存在していました...
概要: 膨大な量のデータを効率的に分析するために、科学者はまず大量の数字を細分化する必要があります。...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
アルパカファミリーの「最強のオープンソースコードモデル」が「スーパーカップ」を発売しました——今朝、...
[[258542]]最近終了した2019年のアカデミー賞授賞式では、最優秀脚本賞や最優秀視覚効果賞を...
5GとAIは未解決の問題に解決策を見つけることができる5G はエッジの究極の未来です。 5G は、普...
私は、IoT を活用して現場サービスと顧客サポートの効率性を向上させることを目指す機器メーカーのクラ...
人工知能は、すでに私たちの世界を微妙かつ広範囲に変化させている、画期的な技術です。クラウド コンピュ...
[51CTO.comからのオリジナル記事] 2015年以降、仮想現実(VR)業界は急速に発展しました...
広く認識されている機械学習の形式には、教師あり学習、教師なし学習、半教師あり学習、強化学習の 4 つ...
[[402233]]市民がVRスキー体験。本紙(記者 陳龍)5月27日、2021年中国国際ビッグデー...
ディープラーニングは人工知能の分野に多大な貢献をしてきましたが、その技術自体には依然として致命的な欠...
コンピューター ビジョン テクノロジー (マシン ビジョンとも呼ばれます) により、機械は周囲の世界...