機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習エンジニアになるには、通常、博士号が必要です。

たとえそれがその立場の必要条件として書かれていなくても、それは次第に自然法則となっていきます。

では、独学の人は、面接官に自分も同じ能力を持っていると納得してもらうために、どのようなプロジェクト経験について書けばよいのでしょうか?

AddedWayという名のネットユーザーがRedditでこの心を揺さぶる質問を提起したところ、大きな議論が巻き起こり、2日間で500回以上閲覧されました。

ディスカッション掲示板では多くの人が適切な提案をしてくれました。

業界に必要なスキル

po-handzというネットユーザーがいるが、彼の意見は80ポイントの賛同を得て、コメント欄のトップを占めた。

プロジェクトを本番環境に導入することで、新卒者や現在の ML エンジニアの99%を上回ることができます。

この点に関して、ある人(モラヴァク)が強い同意を表明した。

この「大多数」は実際には 99.9% 以上を意味します。

ディンロウ氏は、たとえ多くの人が博士号を取得しても、自力でプロジェクトを製品化まで導く経験がないかもしれないと付け加えた。

では、そのような経験をするということはどういう意味でしょうか?

ネットユーザー(BernieFeynman)はそれを簡単に説明しました:

いくつかのモデルを構築します。超素晴らしいものである必要はありません。しかし、モデルがどこで実行されているかをユーザーが確認できるようにする必要があります。たとえば、呼び出すことができる API が存在する必要があります。

もちろん、これは簡単なことではありません。最上階では、プロセス全体がいかに難しいかが詳しく説明されています。

たとえば、通常はモデルが 1 つだけではなく、複数のモデルが存在します。したがって、これらの大きなモデルはサーバーの RAM にロードする必要があります。新しい入力データも受け入れます。これらのデータはテスト データと同じ形式で、スケーリングも行う必要があります。どのようにスケーリングすればよいでしょうか?推論には GPU が必要ですか?その場合、AWS では月額 1,000 ドルかかる可能性があります。予算で対応できますか?時系列データはどうでしょうか?継続的に更新されるモデルとパラメータを追跡する必要があります。さらに、リアルタイムで保守可能なデータ パイプラインも必要です。これは、クリーンなデータセットを扱うよりもはるかに困難です。最後に、ユーザーフレンドリーにするには、完全な UI、Web サイト、nginx スタックが必要です。

新しく博士号を取得したばかりの人はもちろん、経験豊富なデータ サイエンティストの多くは、自分の専門分野でのみ仕事をし、他の人からクリーンなデータ セットを渡されるため、これらのことについて何も知りません。

この点において彼らに勝てば、会社にとってより高い価値が生まれます。

履歴書を台無しにしないでください

実践的なスキルを訓練することは、一つの側面にすぎません。

履歴書の選考プロセスで失敗したくない場合は、ネットユーザー(rudiXOR)が「MLエンジニアを募集している中規模企業」の10大危険地帯をまとめたので、参考にしてください。

まず、MOOC 認定資格をいくつか取得します。役に立たない。試してみた。誰でもクイズをクリックできる。 2 つ目は、Kaggle での成果を誇りすぎることです。多くの大学生が Kaggle コンテストに参加しており、このコンテストが ML エンジニアの仕事とほとんど共通点がないことも知っています。 3 つ目は、3 か月のトレーニングを経て、PCA から LSTM まで、ほぼすべての ML テクニックを習得したことです。誰もそれを本当に信じませんでした。 4 番目に、GitHub プロジェクトは、コードが 1 回だけ送信されたプロジェクトです。それが自分でやったことかどうかは全く分かりません。 5 番目に、GitHub ホームページは新しく、プロジェクトがありません。 6 番目に、このモデルは、より本格的なプロジェクトではなく、おもちゃのデータセットでのみテストされています。 7番目に、どの言語でも「習得」という言葉があります。たとえば、C++、Python、Java、C# などです。8 番目は、履歴書を求人要件と慎重に照合することです (「HR アルゴリズムのバズワード最適化」)。 9番目に、数学/統計に関する知識を証明していません。 10番目は、ソフトウェア開発の経験がないことです。

最初の 9 つのポイントを忘れてしまったとしても、10 番目のポイントを真剣に参照することができます。地雷原を列挙した後、ネットユーザーらは次のように強調した。

独学の場合は、すぐにデータ サイエンティストや ML エンジニアに応募しないでください。まずはデータアナリストやソフトウェアエンジニアに応募してみましょう。 ML を独学で学び、ソフトウェア開発の経験がない場合は、採用しません。

前回の記事を参考にすると、博士号を取得していない場合は、博士号よりも業界での経験が豊富であることが有利になります。

もう一つ

しかし、独学で学ぶのに遅すぎるということはありません。

たとえば、Google Brain の研究者である David Ha 氏は、機械学習を採用する前はすでにゴールドマン・サックスのマネージング・ディレクター (MD) を務めていました。

[[271179]]

それでは皆様頑張って下さい。

Reddit フォーラムにはさらに多くの提案があります:

https://www.reddit.com/r/MachineLearning/comments/c3e9qu/d_those_who_hireinterview_for_machine_learning/

<<:  ディープニューラルネットワークはディープフェイクを検出できる

>>:  ゲイツ氏は人工知能に楽観的だが、グーグルが自動運転車に大きく賭けている理由が理解できない

ブログ    

推薦する

脳をシミュレートする NLP、クヌース賞受賞: 文解析のためのニューロン集団計算

[[402907]]先週、Google Research はディープラーニングにおける概念理解に関す...

...

...

...

知識が求められるポストディープラーニング時代において、知識グラフをいかに効率的かつ自動的に構築できるのでしょうか?

日常生活では、情報を提示する次の 2 つの方法によく遭遇します。表示される情報量はどちらも同じですが...

ディープラーニングで構造化データを処理するにはどうすればよいですか?

この投稿では、ディープラーニングのあまり知られていない応用分野である構造化データに焦点を当てます。こ...

...

米国は自動運転に関する最も厳しい新規制を発行:L2〜L5を完全にカバー、今月30件のテスラ事故が調査された

[[408307]] IT Homeは6月30日、米国東部時間6月29日に米道路交通安全局(NHTS...

オープン語彙検出オープンワールド物体検出コンペティション2023優勝チームソリューション共有

OVDテクノロジーの紹介物体検出は、コンピューター ビジョンの分野における中核的なタスクです。その主...

クリスマスのギフトボックスにロボット犬を見つけますか?ボストン・ダイナミクスがイースターエッグをリリースしたが、ギフトボックスが逃げてしまった

クリスマスが近づいてきました。ボストン ダイナミクスから特別なクリスマス ギフトをお届けします。昨日...

DeepMindは大規模なモデルで帰納法と演繹法を学習できるようにし、GPT-4の精度は13.7%向上した。

現在、大規模言語モデル (LLM) は、特にいくつかの例と中間ステップが与えられた場合に、推論タスク...

人間と踊る!中国の6団体が制作したヒューマノイドロボットがストリートショーに進出

注意してください、小帥は振り向きましたが、スウェットシャツのフードの中には何もありませんでした。さて...

...

AIは教育分野で大きな可能性を秘めています。どのように活用できるでしょうか?

[[238201]]過去 10 年間、学界と AI の専門家は、AI が教育に活用できるかどうかに...