機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

機械学習を独学で学んだら、どうやって仕事を見つければいいのでしょうか?少なくともトップ10の地雷原は避ける

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

機械学習エンジニアになるには、通常、博士号が必要です。

たとえそれがその立場の必要条件として書かれていなくても、それは次第に自然法則となっていきます。

では、独学の人は、面接官に自分も同じ能力を持っていると納得してもらうために、どのようなプロジェクト経験について書けばよいのでしょうか?

AddedWayという名のネットユーザーがRedditでこの心を揺さぶる質問を提起したところ、大きな議論が巻き起こり、2日間で500回以上閲覧されました。

ディスカッション掲示板では多くの人が適切な提案をしてくれました。

業界に必要なスキル

po-handzというネットユーザーがいるが、彼の意見は80ポイントの賛同を得て、コメント欄のトップを占めた。

プロジェクトを本番環境に導入することで、新卒者や現在の ML エンジニアの99%を上回ることができます。

この点に関して、ある人(モラヴァク)が強い同意を表明した。

この「大多数」は実際には 99.9% 以上を意味します。

ディンロウ氏は、たとえ多くの人が博士号を取得しても、自力でプロジェクトを製品化まで導く経験がないかもしれないと付け加えた。

では、そのような経験をするということはどういう意味でしょうか?

ネットユーザー(BernieFeynman)はそれを簡単に説明しました:

いくつかのモデルを構築します。超素晴らしいものである必要はありません。しかし、モデルがどこで実行されているかをユーザーが確認できるようにする必要があります。たとえば、呼び出すことができる API が存在する必要があります。

もちろん、これは簡単なことではありません。最上階では、プロセス全体がいかに難しいかが詳しく説明されています。

たとえば、通常はモデルが 1 つだけではなく、複数のモデルが存在します。したがって、これらの大きなモデルはサーバーの RAM にロードする必要があります。新しい入力データも受け入れます。これらのデータはテスト データと同じ形式で、スケーリングも行う必要があります。どのようにスケーリングすればよいでしょうか?推論には GPU が必要ですか?その場合、AWS では月額 1,000 ドルかかる可能性があります。予算で対応できますか?時系列データはどうでしょうか?継続的に更新されるモデルとパラメータを追跡する必要があります。さらに、リアルタイムで保守可能なデータ パイプラインも必要です。これは、クリーンなデータセットを扱うよりもはるかに困難です。最後に、ユーザーフレンドリーにするには、完全な UI、Web サイト、nginx スタックが必要です。

新しく博士号を取得したばかりの人はもちろん、経験豊富なデータ サイエンティストの多くは、自分の専門分野でのみ仕事をし、他の人からクリーンなデータ セットを渡されるため、これらのことについて何も知りません。

この点において彼らに勝てば、会社にとってより高い価値が生まれます。

履歴書を台無しにしないでください

実践的なスキルを訓練することは、一つの側面にすぎません。

履歴書の選考プロセスで失敗したくない場合は、ネットユーザー(rudiXOR)が「MLエンジニアを募集している中規模企業」の10大危険地帯をまとめたので、参考にしてください。

まず、MOOC 認定資格をいくつか取得します。役に立たない。試してみた。誰でもクイズをクリックできる。 2 つ目は、Kaggle での成果を誇りすぎることです。多くの大学生が Kaggle コンテストに参加しており、このコンテストが ML エンジニアの仕事とほとんど共通点がないことも知っています。 3 つ目は、3 か月のトレーニングを経て、PCA から LSTM まで、ほぼすべての ML テクニックを習得したことです。誰もそれを本当に信じませんでした。 4 番目に、GitHub プロジェクトは、コードが 1 回だけ送信されたプロジェクトです。それが自分でやったことかどうかは全く分かりません。 5 番目に、GitHub ホームページは新しく、プロジェクトがありません。 6 番目に、このモデルは、より本格的なプロジェクトではなく、おもちゃのデータセットでのみテストされています。 7番目に、どの言語でも「習得」という言葉があります。たとえば、C++、Python、Java、C# などです。8 番目は、履歴書を求人要件と慎重に照合することです (「HR アルゴリズムのバズワード最適化」)。 9番目に、数学/統計に関する知識を証明していません。 10番目は、ソフトウェア開発の経験がないことです。

最初の 9 つのポイントを忘れてしまったとしても、10 番目のポイントを真剣に参照することができます。地雷原を列挙した後、ネットユーザーらは次のように強調した。

独学の場合は、すぐにデータ サイエンティストや ML エンジニアに応募しないでください。まずはデータアナリストやソフトウェアエンジニアに応募してみましょう。 ML を独学で学び、ソフトウェア開発の経験がない場合は、採用しません。

前回の記事を参考にすると、博士号を取得していない場合は、博士号よりも業界での経験が豊富であることが有利になります。

もう一つ

しかし、独学で学ぶのに遅すぎるということはありません。

たとえば、Google Brain の研究者である David Ha 氏は、機械学習を採用する前はすでにゴールドマン・サックスのマネージング・ディレクター (MD) を務めていました。

[[271179]]

それでは皆様頑張って下さい。

Reddit フォーラムにはさらに多くの提案があります:

https://www.reddit.com/r/MachineLearning/comments/c3e9qu/d_those_who_hireinterview_for_machine_learning/

<<:  ディープニューラルネットワークはディープフェイクを検出できる

>>:  ゲイツ氏は人工知能に楽観的だが、グーグルが自動運転車に大きく賭けている理由が理解できない

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

チューリングテストは死んだ! ChatGPTは人間テストに合格してもカウントされない、スーパーAIが新参者「ロジックパズル」を評価

世界で最も強力な AI - ChatGPT は、さまざまなテストに合格し、真偽を区別するのが難しい回...

...

Google Cloud Next: カンファレンス全体を通じて人工知能について語る

最近、Google は年次カンファレンス Google Cloud Next を開催しましたが、オー...

ロボットが密かに子供を産んだ?科学者たちも私も衝撃を受けました。

[[438325]]最近このニュースを見たことがあるだろうか。 「ロボットが赤ちゃんを産みました。...

DeepMindの強化学習法はAIと人間のより良いコラボレーションを約束する

[[437442]] [51CTO.com クイック翻訳]囲碁からスタークラフト、Dotaまで、多く...

200 の優れた機械学習チュートリアルの要約「史上最も完全」

この記事には、これまでで最も優れたチュートリアル コンテンツであると一般に考えられている内容が含まれ...

AIスタートアップが成熟するための4つの段階と懸念事項

[[281520]] [51CTO.com クイック翻訳] 現時点では、「人工知能企業」が何であるか...

2022 年のソフトウェア開発に関する 5 つの予測

[[435157]] [51CTO.com クイック翻訳]すべての企業がソフトウェア企業になりつつあ...

販売禁止の影で、国産GPGPUがその穴を埋めることはできるのか?

今年初め、ChatGPTはAIアプリケーションの開発を刺激する火花のようなもので、AI業界は開発の急...

人工知能が防犯カメラの機能を強化している

今日、セキュリティという言葉を聞くと、それは通常、サイバーセキュリティ、特に人工知能に関するものにな...

無人運転と公共交通機関の標準仮想トラックで安全性を確保

深セン初の無人バスの試験運行が始まり、我が国の科学技術力に対する信頼が高まっています。ほぼ同時期に、...

ビッグデータとAIの連携

人工知能と機械学習は、組織がビッグデータからより優れたビジネス洞察を得るのにどのように役立つのでしょ...

江長建、世界初のサイボーグと対談 - JD Smart Community 2.0 全国ローンチカンファレンス ライブプレビュー

[[374688]] 「半オーク」「半魚」… SF映画、漫画、おとぎ話では、それは驚くことではありま...

MIT の新しい研究: ゼロから設計? AIにより誰もが服をデザインできるようになる

[[273025]]海外メディアの報道によると、3Dプリンターの人気の高まりと、Thingivers...

...