10社にインタビュー、機械学習のインタビュー内容をまとめました

[[226434]]

まずは自己紹介をさせてください。私は機械学習の経験が4年以上あり、主な業務内容としては談話分析、テキスト分析、画像分析などです。この分野で最も人材が不足しているのは NLP 分野で、次に画像分析 (CV) で、音声分析やオーディオ分析を主に行う人材はさらに少ないと思います。 5 年間の職務経験を経て、私の目標は中級から上級レベルの役職に就き、データまたは機械学習チームを率いて興味深い研究を行うことです。以下は、面接中に私が遭遇したさまざまな技術的な質問です。参考までに。

グローバルサービス企業の1つ（20〜25分）

ドキュメントマイニングシステムを構築する過程でどのような作業を行いましたか?
PDF、テキストファイル、画像、スキャンされた PDF ファイルなどを含むテラバイト単位のデータファイルが渡されたとします。どのように分類しますか?
スキャンした PDF や書かれた文書をどのように読みますか?
なぜ Naive Bayes は「Naive」と呼ばれるのでしょうか?
ナイーブベイズ分類器について詳しく教えてください。
ディープラーニングとは何ですか?機械学習とディープラーニングの違いは何ですか?

似たような質問がいくつかありましたが、私はそれらについて少し混乱し、面接官がどのような答えを聞きたいのか全く分かりませんでした。私は常により深い技術的側面を探求したいと思っていましたが、彼らはそれについて話すことはありませんでした。そして、私がモデルトレーニング、Tesseract、言語モデルなどについて話すと、彼らはまったくそれを受け入れないようです。おそらく彼らは、既成の結果や簡単な説明を聞きたいと思っているのでしょう。これは、5年前の最初の面接で私が感じたことと非常に似ていました。

グローバルサービス企業パート 2 (40 ～ 45 分)

監督なしで文書を収集するにはどうすればよいでしょうか?
特定のクエリに関連するドキュメントをどのように見つけますか?
TF-IDF について説明してください。
私の経験では、TF-IDF は文書の分類や収集に失敗します。今後どのように改善する予定ですか?
LSTM ニューラルネットワークとは何ですか?仕組みを説明します。
word2vec ベクトルとは何ですか?
Python における可変オブジェクトと不変オブジェクトとはどういう意味ですか?
Python ではどのようなデータ構造を使用しますか?

テキストの類似性を中心とした質問がいくつかありましたが、問題なくすべて回答できました。しかし、前回同様、技術的な話はまだ深入りせず。テキスト解析関連の小さなプロジェクトがいくつかあったことを考慮してか、最終的にオファーを頂きました。

グローバル製造・サービス企業（40分）

不均衡なデータセットでの多クラス分類問題をどのように処理しますか?
テキスト文から言語識別をどのように行うのでしょうか?
中国語や日本語では絵文字をどのように表現しますか?
チャットボットを設計するには？（この時点ではあまり分かりません）
質問と回答のペアが与えられた場合、RNN を使用してチャットボットを設計できますか?
Reddit のデータセットと RNN または LSTM を使用してチャットボットを作成し、10 個の可能な応答が返されたとします。最適な応答を選択するにはどうすればよいでしょうか?または、他の返信を削除するにはどうすればいいですか?
SVM が非線形境界をどのように学習するかを説明してください。

それ以上の質問はいくつか覚えていませんが、ここまで技術的な質問をしてくれた会社は初めてで、とても安心しました。最終的に、この会社も私にオファーを出しました。

設立1周年のヘルスケア企業（50分）

精度と再現率とは何ですか?医療診断において、どちらがより重要だと思いますか？
精度と再現率は別々に定義されます。
ROC 曲線をどのようにプロットしますか? ROC 曲線の下の領域は何を表していますか?
マルチクラス分類タスクで ROC 曲線をプロットするにはどうすればよいですか?
これに加えて、多クラス分類タスクの結果を評価する他の方法にはどのようなものがありますか?
感度と特異度とは何ですか?
ランダムフォレストの「ランダム」とはどういう意味ですか?
テキスト分類はどのように行いますか?
TF-IDF がなければ、テキストを学習したことをどうやって確認できるでしょうか?
機械学習で他に何ができるでしょうか?
ニューラルネットワークは線形ノードで構成されている場合、どのようにして非線形形状を学習できるのでしょうか?非線形境界をどのように学習するのでしょうか?

これ以外にも良い質問がいくつかあります。面接のプロセスは良好でしたが、いくつかの問題については合意に至りませんでした。そして、面接の過程で、社内に ML/DL/DS に注力している人は 2 ～ 3 人しかいないことがわかりました。

アマゾン（50〜55分）

決定木をトレーニングするときのパラメーターは何ですか?
決定木のノードで分割する基準は何ですか?
ジニ係数の計算式は何ですか?
エントロピーの式は何ですか?
決定木はどの特徴を分割するかをどのように決定するのでしょうか?
収集した情報を数学的にどのように計算しますか?本気ですか？
ランダムフォレストの利点は何ですか?
ブースティングアルゴリズムを紹介します。
勾配ブースティングはどのように機能しますか?
AdaBoost アルゴリズムについてどれくらい知っていますか?どのように機能しますか?
SVM ではどのカーネルが使用されますか? SVM の最適化手法とは何ですか?
SVM はどのようにして超平面を学習するのでしょうか?数学的手法を用いて詳しく説明します。
教師なし学習を導入します。アルゴリズムは何ですか?
K-Means クラスタリングアルゴリズムでは、K をどのように定義しますか?
K を定義する方法を少なくとも 3 つ教えてください。
他にどのようなクラスタリングアルゴリズムを知っていますか?
DB-SCAM アルゴリズムについてお話しましょう。
階層的凝集型クラスタリングはどのように機能しますか?
PCA について説明し、PCA の使用に必要な数学的手順について説明します。
PCA を使用することの欠点は何ですか?
CNNはどのように機能するのでしょうか?使用方法の詳細を詳しく教えてください。
CNN におけるバックプロパゲーションについて説明します。
機械学習モデルをどのように展開しますか?
多くの場合、C++ を使用して機械学習モデルをゼロから構築する必要があります。それはできますか?

私はAmazonのレベル6の職種の面接を受けていました。私が言えるのは、彼らの主な焦点はアルゴリズムとその背後にある数学にあるということだけです。残念ながら、私の面接はすべて即興で、数学的な準備をしていなかったので、覚えていることをすべて話しただけでした。しかし、面接官は私がレベル6の仕事に適していないと考えました。一般的な機械学習アルゴリズムの数学的詳細を覚えておけば、Amazon の技術面接に簡単に合格できると思います。

グローバルサービス大手（50～55分）

S 関数の範囲はどのくらいですか?
scikit-learn のどのインストールパッケージでロジスティック回帰を実装できますか?
標準正規分布の平均と分散は何ですか?
Python ではどのようなデータ構造を使用しますか?
テキスト分類の方法とその方法は何ですか?
TF-IDF について説明してください。また、その欠点は何ですか?どうやって克服しますか？
バイグラムとトライグラムとは何ですか?テキスト文の例を使用して、バイグラムとトライグラムの TF-IDF を説明します。
word2vec の用途は何ですか? 例を挙げていただけますか?
ニューラルネットワークをどのように設計しますか?暗くするにはどうすればいいですか?
LSTM はどのように機能しますか?テキストをどのように記憶するのでしょうか?
ナイーブベイズ分類器とは何ですか?
コインを 10 回投げた場合、4 回表が出る可能性はどれくらいでしょうか?
Python でリスト要素のインデックスを取得するにはどうすればいいですか?
pandas を使用して 2 つのデータセットを結合する方法は?
ユーザーの観点から、不正行為をシミュレートする必要がありますが、この問題をどのように解決しますか?
決定木とランダムフォレストのどちらを好みますか?
ロジスティック回帰とランダムフォレストの使用の違いは何ですか?
分類の問題では、決定木とランダムフォレストのどちらを使用しますか?ランダムフォレストを使用する利点は何ですか?

最終的に、その会社は私にデータサイエンスのポジションを提供しました。実際、私はこの技術的な交流を本当に楽しみました。これらの問題は、機械学習とデータサイエンスの最も基本的な問題でもあると思われるかもしれません。しかし、面接中、面接官はこの分野の専門家ではないか、あるいは現在の動向についてあまり知らないのではないかと感じました。

グローバルビジネスマネジメントカンパニー（25～30分）

不均衡なデータセットでは、ランダムフォレストとブースティングのどちらのモデルを選択しますか?なぜ？
どのようなブーストテクニックを知っていますか?
教師あり学習を使用した分類問題にはどのモデルを選択しますか? （約40～50カテゴリー）
統合技術をどのように使用しますか?
SVM はどのように機能しますか?
カーネルとは何ですか?簡単に紹介してください。
非線形回帰を実行するにはどうすればいいですか?
Lasso 回帰と Ridge 回帰とは何ですか?

正直に言うと、このインタビューは少し退屈だったので、真剣に受け止めませんでした。それでも、その質問は良いです。私は15〜16人のチームを率いる役職の面接を受け、その後マネージャー面接と人事面接を受けました。最終的に、彼らは私に高給のコンサルタント職を提供してくれました。

4年目の制作・サービス会社（60分）

履歴書には音声認識を使った話者認識に取り組んだと書かれていますが、具体的な方法は何ですか？
MFCC とは何ですか?
ガウス混合モデルとは何ですか? また、クラスタリングをどのように実現しますか?
期待最大化を達成するにはどうすればよいでしょうか?手順は何ですか?
GMM では確率はどのように計算されますか?
話者識別を実行するときに、GMM-UBM 技術の MAP 調整をどのように実行しますか?
使用している I-Vector テクノロジーについてお話しください。
コンテキストにおける分析要素は何ですか?
JFA と I-vector の違いは何ですか? JFA ではなく I-vector を選択する理由は何ですか?
PLDA I-Vector テクノロジーを使用したことがありますか?
Baidu の Deep Speaker に関する論文を読みましたか?
両方のモデルが利用可能であれば、どちらを選択しますか?
ベイズ情報量基準 (BIC) と赤池情報量基準 (AIC) がどのように機能するかの背後にある数学は何ですか?
BIC と AIC の原理は何ですか?
MFCC 特徴ベクトル行列に欠損データがある場合はどうなりますか?
言語を区別するにはどうすればいいですか?特徴は何ですか？
あなたの分類器は、音声と音楽の分類器に近いでしょうか、それとも音声と非音声の分類器に近いでしょうか?
言語分析アプリケーションにディープニューラルネットワークを展開するにはどうすればよいでしょうか?

はい、これは一体何なのかと疑問に思うかもしれません。偶然にも、私たち二人とも音声分析、特に話者識別に携わっています。したがって、インタビュープロセス全体は音声分析を中心に行われました。面接官が非常にプロフェッショナルであり、私に非常に肯定的なフィードバックを与えてくれたことは明らかでした。その後、その会社から AI ソリューションアーキテクトとしての職をオファーされました。

提案

私は就職活動中、おそらく 25 ～ 30 人の専門家と話をしましたが、その上で私が与えられるアドバイスは次のとおりです。

履歴書は重要です。参加したプロジェクト、Kaggle コンテスト、MOOC 証明書、論文などを含めます。こうして私は紹介なしでAmazonから電話を受けたのです。履歴書は人事担当者や面接官に好印象を与える重要な武器です。
自信と意欲は戦いの半分です。面接に行くときは自信を持って熱意を示しましょう（特にスタートアップ企業やサービス指向の企業の場合）。

面接中に質問に急いで答えないでください。回答の構成方法について少し時間をかけて考え、わからないことがあれば必ず質問してください。面接中は常に落ち着いてください。
概念を説明する際には、自分自身の考えを表現することを忘れないでください。これまで取り組んだ事例をいくつか挙げて、履歴書に記載されているスキルやプロジェクトについてよく理解しておくとよいでしょう。
この分野に不慣れな場合は、履歴書を作成するときに、これまでに取り組んだプロジェクトから始めることができます。また、GitHub アカウントも非常に説得力があります。さらに、より多くの Kaggle コンテストや MOOC コースに参加することもできます。
謙虚な姿勢で、面接官の意見に注意深く耳を傾けてください。時々、RとPython