2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習スキルはどれでしょうか? Quora の 2 つの回答では、最も重要な 10 の機械学習スキルが挙げられています。以下はその翻訳です。

[[207324]]

1. ウラジミール・ノヴァコフスキーからの回答:

機械学習への最大の貢献は、多くの場合ジェネラリストによってなされます。特に 2017 年には、機械学習に関する話題が盛り上がりました。多くの求職者がオンラインでディープラーニングのコースを受講していますが、これは多くの人がコンピュータサイエンスの教科書を読まずに、「20日間でVBScriptを学ぶ」と主張する短期集中コースを読んでいた1990年代を思い出させます。 (実際、今でもそういう人はいる)

依然として重要なスキルとしては、(a) 統計、最適化、定量モデルの構築の基本原則を理解すること、(b) モデルとデータ分析が実際に製品やビジネスにどのように適用されるかを理解することなどが挙げられます。

上記の 2 つのポイントに加えて、2017 年には次のようなスキルも重要になります。

  • 高品質なソフトウェアの書き方を知る。 あるチームが粗悪なソフトウェアを作成し、別のチームがそれを完璧に仕上げる時代は終わりました。 Python や R などのプログラミング言語とそのパッケージを使用すると、データやモデルを簡単に操作できるため、データ サイエンティストや機械学習エンジニアは、高度なプログラミングが可能で、システム設計の基礎を理解できる必要があります。
  • 大規模なデータセットの操作。 「ビッグデータ」という用語は使い古されているが、データ保存のコストは確かに劇的に下がっている。これは、さまざまな分野からのデータセットがますます処理され、モデルが適用されていることを意味します。

はい、ある程度の知識とそれに対応する技術レベルの基礎を理解できたら、コンピュータービジョンと認識のためのディープラーニング、推奨エンジン、NLP(自然言語処理)など、少なくとも 1 つのホットな分野を理解しておくと役立ちます。

2. シヴァム・コーリからの回答:

スキル 1: プログラミング

これはおそらく、データ サイエンティストに求められる最も重要なスキルであり、従来の統計学者よりもはるかに実践的な仕事です。プログラミングは、次の 3 つを含め、さまざまな点で重要です。

  • プログラミングにより、統計を行う能力を高めることができます。統計が大量にあるのに、それを処理する方法がなければ、統計の知識は役に立ちません。
  • プログラミングにより、大規模なデータセットを分析できるようになります。業界で扱うデータセットは、サンプルのアイリス データセット (アイリス データセットは、Fisher (1936) が収集および編集した、一般的に使用されている分類実験データセット) ほど小さくてかわいいものではありません。数百万、あるいはそれ以上のデータを簡単に取得できます。
  • プログラミングを通じて、より優れたデータ処理ツールを作成できます。これには、データを視覚化するシステムの構築、分析実験を自動化するフレームワークの作成、必要なデータがすぐに利用できるように会社全体のデータフローを管理することが含まれます。

スキル2: 定量分析

定量分析は、データ サイエンティストに必要な中核的なスキルです。データ サイエンスの多くは、自然科学や実験によって生成されたデータを分析することで、特に複雑な科学システムの動作を理解することを伴います。定量的なスキルは、次の 3 つを含め、さまざまな点で重要です。

  • 実験の設計と分析: 特に消費者向けインターネット アプリケーションに取り組んでいるデータ サイエンティストにとって、データの記録方法と実験の実行方法は、多数の実験で幅広い仮説をテストする方法を提供します。実験分析ではエラーが発生しやすいため(統計学者に聞いてみてください)、ここでデータ サイエンティストが大いに役立ちます。
  • 複雑な経済/成長システムのモデリング: 顧客離脱モデルや顧客生涯価値モデルなど、いくつかの古典的なモデリングがより一般的です。より複雑なモデリング、たとえば、需要と供給のモデリング、経済的に最適な方法でのサプライヤーのマッチング、どの成長手段が最も価値があるかをより正確に定量化するための企業の成長パイプラインのモデリングなど。最も有名な例は、Uber の価格高騰モデリングです。
  • 機械学習: 機械学習モデルを実装しなくても、データ サイエンティストは、仮説をテストするためのプロトタイプの作成、機能の選択と作成、既存の機械学習システムの強みとこの分野における機会の特定を支援できます。

このスキルに対する需要が最も高いデータ サイエンスの分野はどれですか? 1.物理学者2。統計学者3。エコノミスト4。オペレーションリサーチャー5.さらに、彼らはトップダウンアプローチ(モデル)またはボトムアップアプローチ(データ推論)を通じて複雑なシステムを理解することに非常に慣れています。

スキル3: 製品に対する直感

製品直感は、データ サイエンティストがシステムの定量分析を実行する能力に関連するスキルです。製品知識とは、データ サイエンティストが分析するすべてのデータを生成する複雑なシステムを理解することを意味します。このスキルの重要性は以下に反映されています。

  • 仮説の生成: 製品を熟知しているデータ サイエンティストは、システムの動作を特定の方法で変更できます。仮定は、システムのある側面がどのように動作するかについての「勘」に基づいており、システムがどのように動作するかについての勘を持つには、システムについて知る必要があります。
  • 指標の定義: 従来の分析スキル セットには、企業が特定の目標に対する成功を追跡するために使用できる主要な指標と二次的な指標を特定することが含まれます。データ サイエンティストは、次の 2 つの製品メトリックを作成するために製品を理解する必要があります。1.意図の測定2.価値を生み出すものを測定します。
  • デバッグ分析: 「信じられない」結果は、多くの場合、システムの「信じられない」特性によって発生します。優れた製品知識は、製品検査のスピードアップに役立ち、問題のある箇所をより迅速に特定するのに役立ちます。

製品知識には通常、企業が作成した製品の使用が含まれます。それが不可能な場合は、少なくとも実際に製品を使用している人々と知り合うようにしてください。

スキル4: コミュニケーション

このスキルは重要であり、上記のすべてのスキルの影響を大幅に高めるのに役立ちます。これは非常に重要であり、優れたデータ サイエンティストと優れたデータ サイエンティストを区別するものです。良好なコミュニケーションは、次のようなさまざまな方法で実証できます。

  • 洞察を伝える: 一部のデータ サイエンティストはこれを「ストーリーテリング」と呼んでいます。ここで最も重要なのは、洞察を明確かつ簡潔で効果的な方法で伝え、社内の他の人が効果的に理解できるようにすることです。
  • データの視覚化: わかりやすいグラフは千の言葉に値します。
  • 全体的なコミュニケーション: データ サイエンティストになるということは、エンジニア、デザイナー、プロダクト マネージャー、運用スタッフなど、さまざまな役割とのコラボレーションを含め、チームとして作業することを意味します。全体的なコミュニケーションが良好であれば、信頼と理解が深まります。これは、データ管理を任されている人にとって非常に重要です。

スキル5: チームワーク

最後のスキルは上記の 4 つのスキルを結び付けます。特に、データ サイエンティストは孤立して存在することはできず、チームで作業する必要があります。私が見てきた限りでは、データ サイエンティストは、会社のあらゆる側面に組み込まれている (または少なくとも製品開発組織に存在する) 場合に最も効果を発揮します。

チームワークが重要な理由は、次のとおりです。

  • 無私: これには、他者に援助と指導を提供すること、そして個人のキャリア上の野心よりも会社の使命を優先することが含まれます。
  • 継続的な反復: データ サイエンティストはフィードバックを重視しており、その仕事の多くは、効果的なソリューションに到達するために他のユーザーとの反復とフィードバックの繰り返しを必要とします。
  • 他の人と知識を共有する: データ サイエンスのキャリアは比較的新しい仕事であるため、特に役立つ可能性のあるすべての統計手法、フレームワーク、ライブラリ、言語、ツールを収集する必要がある場合、完全なスキルセットを持っている人はほとんどいません。知識はさまざまなデータ サイエンティストやその組織に分散している可能性があるため、データ サイエンティストが知識、方法、結果を継続的に共有することは特に有用です。

<<:  ディープラーニングと機械学習の違いを理解する

>>:  AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

ブログ    

推薦する

...

ついに誰かが自動運転を明確にした

01 自動運転とは自動運転は無人運転とも呼ばれ、その名の通り、車両が人間の操作なしに周囲の環境を認...

...

各国の人工知能戦略の解釈

現在、人工知能の開発は引き続き盛んに行われており、新世代の科学技術革命の先駆者となりつつあります。米...

最近人気の大型モデルや自動運転コンセプトについてお話ししましょう。

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

...

2026年までにIoT分野のAIサービス収益は36億ドルに達する

iottechnewsによると、IoT分野の人工知能(AI)と機械学習(ML)サービスは年間40%成...

人工知能の時代に教育はどのように変化するのでしょうか?

「教育は人材を育成する長期的な取り組みなので、将来を見据えたものであるべきだ。」先日開催された人工...

データ分析とAIのミスが原因の注目度の高い事件9件

2017年、『エコノミスト』誌は、石油ではなくデータが世界で最も価値のある資源になったと宣言しました...

2021 年に注目すべき 8 つのロボティック プロセス オートメーションのトレンド

【51CTO.com クイック翻訳】今日、ロボティック・プロセス・オートメーション(RPA)は、企業...

...

人工知能への恐怖現象を探る

現在、人工知能は人類に大きな発展の機会をもたらす一方で、さまざまなリスクや課題も伴っています。科学技...

ああはは、それだ!人気の機械学習アルゴリズムの 4 つの「なるほど!」という瞬間

ほとんどの人は 2 つのグループに分かれます。これらの機械学習アルゴリズムが理解できません。アルゴリ...

モンローとドラゴンマザーがあなたと話すことを学びましょう。静止画とビデオだけです

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

TCPとUDPの違いと、フロー制御、輻輳制御、高速再送、高速回復アルゴリズムの詳細な説明

[[413351]] UDPとTCPの違い前回の記事では、TCP の接続を確立するための 3 ウェイ...