2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習のスキルや知識は何ですか?

2017 年に最も価値のある機械学習スキルはどれでしょうか? Quora の 2 つの回答では、最も重要な 10 の機械学習スキルが挙げられています。以下はその翻訳です。

[[207324]]

1. ウラジミール・ノヴァコフスキーからの回答:

機械学習への最大の貢献は、多くの場合ジェネラリストによってなされます。特に 2017 年には、機械学習に関する話題が盛り上がりました。多くの求職者がオンラインでディープラーニングのコースを受講していますが、これは多くの人がコンピュータサイエンスの教科書を読まずに、「20日間でVBScriptを学ぶ」と主張する短期集中コースを読んでいた1990年代を思い出させます。 (実際、今でもそういう人はいる)

依然として重要なスキルとしては、(a) 統計、最適化、定量モデルの構築の基本原則を理解すること、(b) モデルとデータ分析が実際に製品やビジネスにどのように適用されるかを理解することなどが挙げられます。

上記の 2 つのポイントに加えて、2017 年には次のようなスキルも重要になります。

  • 高品質なソフトウェアの書き方を知る。 あるチームが粗悪なソフトウェアを作成し、別のチームがそれを完璧に仕上げる時代は終わりました。 Python や R などのプログラミング言語とそのパッケージを使用すると、データやモデルを簡単に操作できるため、データ サイエンティストや機械学習エンジニアは、高度なプログラミングが可能で、システム設計の基礎を理解できる必要があります。
  • 大規模なデータセットの操作。 「ビッグデータ」という用語は使い古されているが、データ保存のコストは確かに劇的に下がっている。これは、さまざまな分野からのデータセットがますます処理され、モデルが適用されていることを意味します。

はい、ある程度の知識とそれに対応する技術レベルの基礎を理解できたら、コンピュータービジョンと認識のためのディープラーニング、推奨エンジン、NLP(自然言語処理)など、少なくとも 1 つのホットな分野を理解しておくと役立ちます。

2. シヴァム・コーリからの回答:

スキル 1: プログラミング

これはおそらく、データ サイエンティストに求められる最も重要なスキルであり、従来の統計学者よりもはるかに実践的な仕事です。プログラミングは、次の 3 つを含め、さまざまな点で重要です。

  • プログラミングにより、統計を行う能力を高めることができます。統計が大量にあるのに、それを処理する方法がなければ、統計の知識は役に立ちません。
  • プログラミングにより、大規模なデータセットを分析できるようになります。業界で扱うデータセットは、サンプルのアイリス データセット (アイリス データセットは、Fisher (1936) が収集および編集した、一般的に使用されている分類実験データセット) ほど小さくてかわいいものではありません。数百万、あるいはそれ以上のデータを簡単に取得できます。
  • プログラミングを通じて、より優れたデータ処理ツールを作成できます。これには、データを視覚化するシステムの構築、分析実験を自動化するフレームワークの作成、必要なデータがすぐに利用できるように会社全体のデータフローを管理することが含まれます。

スキル2: 定量分析

定量分析は、データ サイエンティストに必要な中核的なスキルです。データ サイエンスの多くは、自然科学や実験によって生成されたデータを分析することで、特に複雑な科学システムの動作を理解することを伴います。定量的なスキルは、次の 3 つを含め、さまざまな点で重要です。

  • 実験の設計と分析: 特に消費者向けインターネット アプリケーションに取り組んでいるデータ サイエンティストにとって、データの記録方法と実験の実行方法は、多数の実験で幅広い仮説をテストする方法を提供します。実験分析ではエラーが発生しやすいため(統計学者に聞いてみてください)、ここでデータ サイエンティストが大いに役立ちます。
  • 複雑な経済/成長システムのモデリング: 顧客離脱モデルや顧客生涯価値モデルなど、いくつかの古典的なモデリングがより一般的です。より複雑なモデリング、たとえば、需要と供給のモデリング、経済的に最適な方法でのサプライヤーのマッチング、どの成長手段が最も価値があるかをより正確に定量化するための企業の成長パイプラインのモデリングなど。最も有名な例は、Uber の価格高騰モデリングです。
  • 機械学習: 機械学習モデルを実装しなくても、データ サイエンティストは、仮説をテストするためのプロトタイプの作成、機能の選択と作成、既存の機械学習システムの強みとこの分野における機会の特定を支援できます。

このスキルに対する需要が最も高いデータ サイエンスの分野はどれですか? 1.物理学者2。統計学者3。エコノミスト4。オペレーションリサーチャー5.さらに、彼らはトップダウンアプローチ(モデル)またはボトムアップアプローチ(データ推論)を通じて複雑なシステムを理解することに非常に慣れています。

スキル3: 製品に対する直感

製品直感は、データ サイエンティストがシステムの定量分析を実行する能力に関連するスキルです。製品知識とは、データ サイエンティストが分析するすべてのデータを生成する複雑なシステムを理解することを意味します。このスキルの重要性は以下に反映されています。

  • 仮説の生成: 製品を熟知しているデータ サイエンティストは、システムの動作を特定の方法で変更できます。仮定は、システムのある側面がどのように動作するかについての「勘」に基づいており、システムがどのように動作するかについての勘を持つには、システムについて知る必要があります。
  • 指標の定義: 従来の分析スキル セットには、企業が特定の目標に対する成功を追跡するために使用できる主要な指標と二次的な指標を特定することが含まれます。データ サイエンティストは、次の 2 つの製品メトリックを作成するために製品を理解する必要があります。1.意図の測定2.価値を生み出すものを測定します。
  • デバッグ分析: 「信じられない」結果は、多くの場合、システムの「信じられない」特性によって発生します。優れた製品知識は、製品検査のスピードアップに役立ち、問題のある箇所をより迅速に特定するのに役立ちます。

製品知識には通常、企業が作成した製品の使用が含まれます。それが不可能な場合は、少なくとも実際に製品を使用している人々と知り合うようにしてください。

スキル4: コミュニケーション

このスキルは重要であり、上記のすべてのスキルの影響を大幅に高めるのに役立ちます。これは非常に重要であり、優れたデータ サイエンティストと優れたデータ サイエンティストを区別するものです。良好なコミュニケーションは、次のようなさまざまな方法で実証できます。

  • 洞察を伝える: 一部のデータ サイエンティストはこれを「ストーリーテリング」と呼んでいます。ここで最も重要なのは、洞察を明確かつ簡潔で効果的な方法で伝え、社内の他の人が効果的に理解できるようにすることです。
  • データの視覚化: わかりやすいグラフは千の言葉に値します。
  • 全体的なコミュニケーション: データ サイエンティストになるということは、エンジニア、デザイナー、プロダクト マネージャー、運用スタッフなど、さまざまな役割とのコラボレーションを含め、チームとして作業することを意味します。全体的なコミュニケーションが良好であれば、信頼と理解が深まります。これは、データ管理を任されている人にとって非常に重要です。

スキル5: チームワーク

最後のスキルは上記の 4 つのスキルを結び付けます。特に、データ サイエンティストは孤立して存在することはできず、チームで作業する必要があります。私が見てきた限りでは、データ サイエンティストは、会社のあらゆる側面に組み込まれている (または少なくとも製品開発組織に存在する) 場合に最も効果を発揮します。

チームワークが重要な理由は、次のとおりです。

  • 無私: これには、他者に援助と指導を提供すること、そして個人のキャリア上の野心よりも会社の使命を優先することが含まれます。
  • 継続的な反復: データ サイエンティストはフィードバックを重視しており、その仕事の多くは、効果的なソリューションに到達するために他のユーザーとの反復とフィードバックの繰り返しを必要とします。
  • 他の人と知識を共有する: データ サイエンスのキャリアは比較的新しい仕事であるため、特に役立つ可能性のあるすべての統計手法、フレームワーク、ライブラリ、言語、ツールを収集する必要がある場合、完全なスキルセットを持っている人はほとんどいません。知識はさまざまなデータ サイエンティストやその組織に分散している可能性があるため、データ サイエンティストが知識、方法、結果を継続的に共有することは特に有用です。

<<:  ディープラーニングと機械学習の違いを理解する

>>:  AIをやりたいのですが、開発ツールはどのように選べばいいですか?この入門ガイドはあなたのためのものです

ブログ    

推薦する

AI モデルにバックドアがある可能性があります。チューリング賞受賞者が53ページの論文を発表「悪意ある予測には注意」

「敵対的事例」は古くからある問題です。画像内の数ピクセルを変更するなど、通常のデータにわずかな外乱...

...

確率的隠れ層モデルに基づくショッピングペアリングプッシュ:アリババが新しいユーザー嗜好予測モデルを提案

論文:混合モデルアプローチによる電子商取引プッシュ通知での補完製品の推奨論文リンク: https:/...

5Gベアラネットワークの運用は難しいが、機械学習技術で解決できる

5G の商用化が近づいており、通信事業者が 5G ベアラ ネットワークを構築するための時間はあまり残...

...

中国移動研究所のチャン・ヤオビン氏:AI時代の技術マネージャーとして、戦闘能力とは何でしょうか?

[[260907]] [[260908]] AIはさまざまな産業に大きな変化をもたらします。よりイ...

マスク氏、XデータをAIの訓練に利用していると認める「マイクロソフトは使えないが、自分なら使える」

マスク氏はついに我慢できなくなり、X のデータを AI に入力し始めました。過去 2 日間で、X が...

知能ロボット技術の応用と開発動向

王耀南院士が2020年国家ロボット開発フォーラムで報告著者プロフィール:王耀南、中国工程院院士、湖南...

天津市が顔認証訴訟で勝利、コミュニティが顔認証を唯一のアクセス手段として使用することは違法と判断

天津の不動産管理会社は、コミュニティへの出入りの唯一の方法として顔認証を使用していたとして住民から訴...

深海か青い海か?自律型水中ロボットが急速に発展

科学技術の継続的な発展と革新が生産性の継続的な進歩を推進しています。産業革命以来、機械化された作業は...

...

毎日のアルゴリズム: 階段登り問題

[[433205]]階段を登っているとします。建物の最上部に到達するまでに n 歩かかります。一度に...

図解による古典的なプロセススケジューリングアルゴリズム

[[382804]]この記事はWeChatの公開アカウント「Flying Veal」から転載したもの...

AIの将来はどうなるのでしょうか?

人間のような知能を実現するという永遠の夢を超えて、AI の将来は消費者市場と商業市場の両方で極めて重...

人工知能の知られざる歴史: 目に見えない女性プログラマーたち

この 6 部構成のシリーズでは、AI の人類史を探り、革新者、思想家、労働者、さらには小規模なトレー...