数年間この業界に携わってきたデータ サイエンティストとして、私は LinkedIn や QuoLa で、学生や転職を希望する人々と頻繁に接触し、機械学習のキャリアに関するアドバイスやガイダンスで、彼らがコースを選択するのを手伝っています。いくつかの質問は教育の進路やプログラムの選択を中心にしたものでしたが、多くの質問は、今日のデータサイエンス分野ではどのようなアルゴリズムやモデルが一般的であるかを中心にしたものでした。 選択できるアルゴリズムが非常に多いため、どこから始めればよいか分からない場合があります。このコースには、今日の業界で一般的に使用されていないアルゴリズムが含まれる場合があり、現在は一般的ではないが特に有用な方法については取り上げない場合があります。ソフトウェアベースのプログラムでは重要な統計概念が除外される可能性があり、数学ベースのプログラムではアルゴリズム設計のいくつかの重要なトピックが省略される可能性があります。 私は、データ サイエンティストを目指す人向けに、統計モデルと機械学習モデル (教師ありおよび教師なし) に特に焦点を当てた短いガイドをまとめました。これらのトピックには、教科書、大学院レベルの統計コース、データ サイエンス ブートキャンプ、その他のトレーニング リソースが含まれます。 (これらの一部は記事の参考セクションに含まれています)。機械学習は統計学の分野であるため、機械学習アルゴリズムは、データマイニングやコンピューターサイエンスに基づく方法とともに、技術的には統計知識の範疇に入ります。ただし、一部のアルゴリズムはコンピュータ サイエンスのコースで教えられる内容と重複しており、また多くの人が従来の統計手法と新しい手法を区別しているため、リストの 2 つのブランチを分離します。 統計の方法には、ブートキャンプや認定プログラムで概説されている一般的な方法と、大学院の統計プログラムで一般的に教えられているあまり一般的ではない方法(ただし、実際には大きな利点がある)が含まれます。提案されたツールはすべて私が定期的に使用しているものです。
機械学習はこれらのフレームワークの多くを拡張しますが、特に K 平均法クラスタリングと一般化線形モデリングが有名です。多くの業界で役立つ一般的なテクニック (および、ブートキャンプや認定プログラムでは驚くほど役立つが、学校ではほとんど教えられていないあまり知られていないアルゴリズム) には、次のものがあります。
選択した業界によっては、自然言語処理 (NLP) またはコンピューター ビジョンに関連する追加のアルゴリズムが必要になる場合があります。ただし、これらはデータサイエンスと機械学習の専門分野であり、これらの分野に参入する人は通常、すでにその特定の分野の専門家です。 学術プログラム以外でこれらの方法を学ぶためのリソースには、次のようなものがあります。
|
<<: 自動運転の体験はクールで、将来的には多くの交通アルゴリズムが登場するだろう
>>: 人工知能、VR、音声検索、従来のマーケティングモデルを変える「三銃士」
一気に15言語で22の1位を獲得!いや、もっとすごいのは、彼は40以上の言語を読んで理解できるという...
ディープラーニングの分野では、「転移学習」という用語がますます注目を集めています。パフォーマンスが優...
Google が携帯電話向けの初の音声人工知能製品を発表してから 5 か月後、同社は Apple の...
OpenAI 宮殿ドラマが終わったばかりですが、すぐにまた別の騒動が勃発しました。ロイター通信は、ア...
文芸グラフィックの分野で非常に人気となっている Stability AI は、本日、2024 年向け...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
0 コードの大規模モデルを20 ドル未満で微調整できますか?プロセスも非常に簡単で、必要なステップは...
[[279631]]中国の従業員は職場でロボットをより信頼しているのでしょうか?調査によると、中国の...
テスラは2020年10月からFSDベータ版を徐々に展開しており、選ばれた自動車所有者のグループでテス...
私たちは、ロボット工学、スマート家電、スマート小売店、自動運転車技術などによって推進される新しい時代...
K平均法アルゴリズムの紹介K-means は、機械学習でよく使用されるアルゴリズムです。これは教師な...