Apple、Googleなど大企業のAI面接の質問を入手しました。あなたは挑戦してみますか?

Apple、Googleなど大企業のAI面接の質問を入手しました。あなたは挑戦してみますか?

何?大手テクノロジー企業の面接の質問が漏洩した?そんなわけないですよね~。海外の有名なブログプラットフォーム「Medium」に、Apple、Google、Facebookなどの一流テクノロジー企業のAI面接の質問を時間をかけてまとめたエンジニアがいて、多くの読者に多大な助けを与えています。実際に彼の記事を読んで事前に準備し、大手企業の面接に合格した人もいます。この記事はこれらの記事を収集して整理し、中国語に翻訳したものです。きっとあなたにインスピレーションを与えると思います。今があなたの人生の頂点に達する瞬間かもしれません!

[[227089]]

1. マイクロソフト

[[227090]]

企業における Microsoft の優位性はよく知られています。 Microsoft はクラウド コンピューティングの波に乗りました。第 1 四半期では、Azure サービスと Office 365 オンライン生産性向上事業の収益がそれぞれ 90% と 42% 増加しました。

Microsoft の CEO である Satya Nadella 氏が Microsoft の全従業員に宛てた最近の書簡の中で、イノベーションの次の段階を形成するために、Intelligent Cloud と Intelligent Edge という 2 つの新しいチームが結成されたと述べられています。これは、人工知能がマイクロソフトのビジネスに大きな変化をもたらすことを意味します。言うまでもなく、マイクロソフトはこの発表後、AI関連の従業員をさらに雇用する可能性が高い。だから、今があなたのチャンスです。

面接プロセス

エンジニアを採用する他のほとんどの企業と同様に、Microsoft には従来の面接プロセスがあります。通常は電話面接(コーディングを含む)の後に現地面接が行われます。現地での面接は4~5回程度となります。面接では、研究やモデルなど、データ サイエンス関連のトピックを詳しく掘り下げる質問が 2 ~ 3 問ある場合があります。残りはコーディングスキルをテストするように設計されています。

面接の質問

  • k 個 (この場合は k = 2) の配列を結合して並べ替えます。
  • 500 万件の検索クエリの代表的なサンプルを最も適切に選択するにはどうすればよいでしょうか?
  • 3 人の友人が今日は雨が降ると言った場合、それぞれが嘘をつく確率が 3 分の 1 だとすると、今日雨が降る確率はどれくらいでしょうか。
  • Naive Bayes の基本を説明していただけますか? しきい値を設定する方法を教えてください。
  • MapReduce とは何か、どのように機能するかを説明していただけますか?
  • SVMについて説明していただけますか?
  • 新しい観測が異常かどうかをどのように検出しますか? バイアスと分散のトレードオフは何ですか?
  • 製品のユーザーベースからサンプルをランダムに選択するにはどうすればよいでしょうか?
  • オートコンプリートはどのように実装しますか?
  • 勾配ブースティングの仕組みを説明します。
  • 整数のリスト内の部分列の最大値を見つけます。
  • Twitter の投稿をどのように要約しますか?
  • 機械学習アルゴリズムを適用する前に、データのラングリングとクリーニングの手順を説明します。
  • 不均衡なバイナリ分類にどう対処するか?
  • データポイント間の距離を測定するにはどうすればよいでしょうか?
  • 差異を定義します。
  • ボックス プロットとヒストグラムの違いは何ですか?
  • L2 正規化回帰をどうやって解くのでしょうか?
  • 計算上のトリックを使用して逆行列をより速く計算するにはどうすればよいでしょうか?
  • 電卓を使わずに一連の計算を実行する方法。手順の背後にあるロジックを説明します。
  • 良いデータ視覚化と悪いデータ視覚化の違いは何でしょうか?
  • パーセンタイルをどうやって見つけますか? そのためのコードを書いてください。
  • 値の範囲から最大合計部分列を見つけます。
  • 正規化メトリック L1 と L2 の違いは何ですか?
  • 単語が回文であるかどうかを確認する関数を作成します。

2. アマゾン

[[227091]]

Amazon は「地球最大の書店」から「地球で最も顧客中心の企業」へと変貌しました。 CEOのジェフ・ベゾスは、株主への手紙の中で、何度も会社の進むべき道を明確にしてきました。 Amazon は Alexa で深層言語学習機能を展開し、AWS を通じて AI 向けのクラウド インフラストラクチャを提供しています。また、Amazon.com 上で世界初の大規模な推奨システムを構築し、導入しました。

面接プロセス

現地面接プロセス中に、弁護士面接が行われます。バーレイザーとは、面接官の中で最も経験豊富な人物であり、その動機は、あなたが Amazon の従業員の上位 50% に入るかどうかを判断することです。基準引き上げ者は、他の面接官がその候補者を気に入っているかどうかに関係なく、その候補者を拒否する権利を持ちます。

面接の質問

  • ロジスティック回帰モデルの係数が何であるかをどうやって知るのでしょうか?
  • 凸コスト関数と非凸コスト関数の違い。コスト関数が非凸である場合、それは何を意味しますか?
  • ランダムな重みの割り当ては、隠し層のユニットに等しい重みを割り当てるよりも優れていますか?
  • 棒グラフがあり、その上に水を注いでいるところを想像すると、棒グラフにどれだけの水が入るかをどのように判断するでしょうか?
  • オーバーフィッティングとは何ですか?
  • プライム会員料金の変更は市場にどのような影響を与えますか?
  • 勾配チェックが重要なのはなぜですか?
  • ツリー、SVM、ランダム フォレスト、XGBoost アルゴリズムについて説明します。彼らの長所と短所について話します。
  • 最も重いビー玉を選ぶために、9 個のビー玉を秤で 3 回計量するにはどうすればよいでしょうか。
  • 過去 6 か月間にシアトルの顧客にとって最も収益性の高い上位 10 個の製品の累計を計算します。
  • 特定のモデルを選択するための基準を説明します。次元削減が重要な理由は何ですか?
  • ロジスティック回帰と線形回帰の仮定は何ですか?
  • 特定の顧客行動を予測する完璧な(100%正確な)分類モデルを構築できれば、
  • アプリケーションではどのような問題が発生する可能性がありますか?
  • アイテムの位置 A にあるアイテムの確率は 0.6、アイテムの位置 B にあるアイテムの確率は 0.8 です。 Amazon で商品を見つける確率はどれくらいですか?
  • IDと数量の列を持つ「csv」ファイルがあり、5000万件のレコードがあり、データサイズが2GBの場合、
  • 任意の言語で QUANTITY 列を集計するプログラムを作成します。
  • 配列を使用して循環キューを実装します。
  • 月単位の時系列データがあり、データレコードの数が多い場合、今月の値が前の月と大幅に異なるかどうかをどのように調べるのでしょうか。
  • Lasso 回帰とリッジ回帰の比較。
  • MLE 推論と MAP 推論の違いは何ですか?
  • 入力として N 個のランダムにソートされた数値の配列と int K を持つ関数を指定すると、K 個の最大の数値を含む配列が返されます。
  • ユーザーが Amazon の Web サイトを閲覧する際、いくつかのアクションを実行します。次のアクションが購入である場合、モデルを構築する最適な方法は何でしょうか?
  • 国全体の確率が低いことを考慮して、都市における病気の発生確率を推定します。この都市で無作為に1,000人に質問したところ、全員が否定的(病気ではない)と回答しました。この都市で病気が発生する確率はどれくらいですか?
  • SVM について説明します。
  • K-means はどのように機能しますか? どの距離メトリックを選択しますか? 異なる機能に異なるダイナミック レンジがある場合はどうなりますか?
  • ブースティングとは何ですか?

3. フェイスブック

[[227092]]

Facebook については説明の必要はありません。 Facebook のエンジニアは、約 10 年にわたって大量のデータを蓄積した後、2013 年に CNN の実験を開始しました。その後、Facebook は AI とディープラーニングの重要性を認識し、Google Brain から最初の AI エンジニアである Marc'Aurelio Ranzato を採用しました。その後、CNNの発明者であるヤン・ルカン氏が採用されました(彼は現在、Facebook AI研究所の責任者ではありません)。

面接プロセス

Facebook の面接プロセスは、ほとんどの企業で使用されている標準的な面接プロセスです。参考:

https://www.facebook.com/notes/facebook-engineering/get-that-job-at-facebook/10150964382448920/

面接の質問

  • 100 階建てのビルに同じ卵が 2 つあります。 2 個の卵を使って、卵が必ず割れる閾値 N を見つけるにはどうすればよいでしょうか。
  • 100 枚のコインのセットからランダムに 1 枚のコインが抽出されます。不公平なコイン 1 枚 (すべて表)、公平なコイン 99 枚 (表 1 枚、裏 1 枚) が抽出され、10 回投げられます。結果が 10 回とも表だった場合、コインが不公平である確率はどれくらいでしょうか。
  • Python で数値データセットのソートアルゴリズムを記述します。
  • Facebook は、ユーザーが直接誕生日の情報を提供しているかどうかに関係なく、ユーザーの誕生日の月と日を推定する方法の開発を目指しています。このタスクを達成するために、どのような方法とデータをお勧めしますか? Python 組み込みパッケージを使用して 'csv' データを処理します。
  • Facebook の「友達」の提案を自動的に生成するための 2 つの異なるバックエンド エンジンの相対的なパフォーマンスをどのように比較しますか? KPI が与えられたら、適切なメトリックを選択し、ETL を実行します。 (SQL / コードの使用)
  • あなたはシアトル行きの飛行機に乗ろうとしています。傘を持っていくべきか迷います。ランダムに選んだ 3 人の友人に電話をかけると、それぞれが独立して雨が降っているかどうかを尋ねます。あなたの友人はそれぞれ、あなたに本当のことを言う可能性が 3 分の 2 あり、嘘をついてあなたと関わる可能性が 3 分の 1 あります。 3人の友達全員が雨が降っていると言っています。シアトルの実際の降雨確率はどれくらいですか? (Microsoft の質問と同じ)
  • 2 人のプレイヤー A と B によるゲームを考えてみましょう。 A には 8 個、B には 6 個あります。ゲームは以下のように進行します。まず、A は公平な 6 面サイコロを振り、サイコロの目によって A が B から受け取る宝石の数が決まります。次に、B が同じサイコロを振ると、まったく同じことが逆の順序で起こります。このラウンドは終了しました。ゲーム終了時により多くの宝石を持っている人がゲームに勝ちます。ラウンド終了時にプレイヤーの宝石の数が同じ場合は同点となり、次のラウンドに進みます。 B が第 1、2、...、n ラウンドで勝つ確率はどれくらいでしょうか?
  • 文中の各文字の番号を取得するにはどうすればよいでしょうか?
  • 性別または身長がわかれば、平均して男性が女性よりも背が高いことをどのように証明できるでしょうか?
  • モンキーパッチングとは何ですか?
  • オブジェクトのリスト A と、A から 1 つの要素を削除したリスト B が与えられた場合、削除された要素を見つけます。
  • 整数(正と負の両方)のリストが与えられた場合、合計がゼロになる整数のペアが少なくとも 1 つあるかどうかを調べるアルゴリズムを記述します。アルゴリズムのパフォーマンスをどのように改善しますか?
  • 2 つの変数のヒストグラムを作成します。
  • SQL で返信数のヒストグラムを作成します (x 件の返信がある投稿の数、x + 1 件の返信がある投稿の数など)。ユーザーごとの 1 日あたりの機能使用状況の概要を含む表を作成します (ユーザーの最後のアクションを追跡し、各日の概要を示します)。
  • カジノでサイコロを振って、5が出れば勝ちとなり、10ドルのボーナスを受け取ります。いくら稼げますか? 勝つまでプレイした場合 (どれだけ時間がかかるかに関係なく)、予想される支払額はいくらですか?
  • Facebook 広告で顧客にサインアップしてもらおうとしている場合、中小企業にどのような指標を示しますか?
  • 送信した友達リクエストと受信した友達リクエストのテーブルが与えられた場合、最も多くの友達を持つユーザーを見つけます。ユーザーあたりのいいね数やプラットフォーム上での滞在時間は増加していますが、ユーザー総数は減少しています。最も可能性の高い根本原因は何でしょうか?
  • プロフィールに実際の高校を記載している人はどれくらいいるでしょうか? 効果のない学校を見つけるために、大規模な方法をどのように検出し、展開できるでしょうか?
  • ニックネーム (Pete、Andy、Nick、Rob など) を本名にマッピングするにはどうすればよいでしょうか?
  • Facebook は、「いいね!」が前年比 10% 増加していると考えています。なぜこのようなことが起きているのでしょうか?
  • 幹部がニュースフィード広告の数を 2 倍にしたいと言った場合、それが良いアイデアかどうかをどうやって判断するのでしょうか。

4. グーグル

[[227093]]

Google には、世界でも最も才能のある AI 研究科学者、データ エンジニア、データ サイエンティストがいます。 Google CEO サンダー・ピチャイ氏は、Google を AI ファーストの企業として改革することに注力しています。 Google はすでに、Gmail からデータが豊富な自動運転システムまで、すべてまたはほとんどの製品に AI コーディングを導入しています。

面接プロセス

Google の技術面接プロセスは標準的な技術面接プロセスです。電話によるビデオ面接と現地での面接から構成されます。詳細については、以下を参照してください。

https://careers.google.com/how-we-hire/interview/#interviews-for-software-engineering-and-technical-roles

面接の質問

  • 1 / x の導関数は何ですか?
  • 曲線log(x + 10)をプロットする
  • 顧客満足度調査をどのように設計すればよいでしょうか?
  • コインを10回投げると、表が8回、裏が2回出ます。コインが公平かどうかを分析するにはどうすればよいでしょうか? p 値とは何ですか?
  • コインは10枚あります。コインを 10 回 (合計 100 回) 投げて、結果を観察します。コインの公平性をテストするためのアプローチを変更する予定はありますか?
  • 正規分布ではない確率分布とその適用方法を説明してください。
  • 特徴選択が使用されるのはなぜですか? 2 つの予測変数の相関が高い場合、ロジスティック回帰の係数にどのような影響がありますか? 係数の信頼区間はどれくらいですか?
  • K 平均法とガウス混合モデル: K 平均法と EM の違いは何ですか?
  • ガウス混合モデルを使用する場合、それが機能することをどのようにして知るのでしょうか? (正規分布)
  • クラスタリング プロジェクトでラベルがわかっている場合、モデルのパフォーマンスをどのように評価しますか?
  • 変更を加えたGoogleアプリがありました。インジケーターが増加するかどうかをテストするにはどうすればいいですか?
  • データ分析のプロセスについて説明してください。
  • なぜロジスティック回帰ではなく、GBM なのでしょうか?
  • GMM方程式を導出します。
  • 動画を気に入ったユーザーの数を測定するにはどうすればよいでしょうか?
  • 二変量正規分布のシミュレーション
  • 導出された分布の分散
  • 毎年何人が Google に応募しますか?
  • 中央値の推定値を構築するにはどうすればよいでしょうか?
  • 回帰モデルの 2 つの係数推定値のそれぞれが統計的に有意である場合、両方の検定が依然として有意であると予想されますか?

5. ウーバー

[[227094]]

面接プロセス

Uber の技術面接プロセスは、電話ビデオ面接と現地面接 (通常 5 ~ 6 回の面接) で構成される標準的な技術面接プロセスです。 Uber はエンジニアリング ブログでこれについて詳しく説明しています。

https://eng.uber.com/engineering-interview/

面接の質問

  • バイナリ分類を説明する
  • ROC曲線のAUCを計算する
  • A/B テストの使い方は?
  • ランダムベルヌーイ試行ジェネレータを使用して正規分布から値のサンプルを返す関数を作成します。
  • P値とは何を意味しますか?
  • 線形回帰、線形仮定、線形方程式を説明する
  • CLT を定義し、Uber とどのように関係しますか?
  • ロジスティック回帰、ロジスティック仮定、ロジスティック方程式を説明する
  • すべての主要都市のストリートビュー写真を撮影する車両を揃えるには、どれくらいの費用がかかるでしょうか?
  • レンタカー運転手のコストをモデル化するにはどうすればよいでしょうか?
  • 急増価格アルゴリズムの仕組みと、どの戦略がより効果的かをテストする方法について説明してください。
  • クロス検証とは何ですか?
  • ネットワーク効果は、実験を定義し、結果を測定するための選択にどのように影響しますか?
  • 異常検出方法とは何ですか?
  • 運転状況や渋滞は Uber の収益にどのような影響を与えますか?
  • 運転状況や渋滞は Uber の収益やドライバーの体験にどのような影響を与えますか?
  • キャッシュはどのように機能し、データ サイエンスでどのように使用できるのでしょうか?
  • さまざまなマーケティング チャネル間でマーケティング費用を最適化するにはどうすればよいでしょうか?
  • 都市の Uber Pool の半径を計算するにはどうすればいいですか?
  • 場所を Uber プールに含めるかどうかはどのように決定されますか?
  • 時系列予測技術とは何ですか?
  • PCA、PCA の仮定、PCA 方程式について説明します。
  • Uber は交通渋滞を引き起こしますか?

6. アップル

[[227095]]

AI は Apple ハードウェア上のソフトウェアに組み込まれています。つまり、人工知能はAppleのサービスなのです。 2018年第1四半期の収益報告によると、同社のサービス収益は前年比18%増加した。昨年12月末時点で、全サービス商品の有料ユーザー数は2億4000万人を突破した。

面接プロセス

エンジニアを採用する他のほとんどの企業と同様に、Apple では電話と現地での面接を組み合わせた典型的な面接プロセスを採用しています。インタビュー現場にはおよそ 4 ~ 5 人のチームメンバーがいました。詳細については、以下を参照してください。

https://www.quora.com/What-is-the-recruiting-and-hiring-process-of-Apple-How-does-one-contact-their-HR-department

面接の質問

  • 数百万の取引量を持つ数百万のユーザーを引き付け、それらのユーザーを意味のあるセグメントに集中させるにはどうすればよいでしょうか?
  • 詐欺の脅威を排除するためにデータを事前にスクリーニングしますが、詐欺事件の真の姿を判別するために使用できるデータ サンプルをどのように見つけるのでしょうか?
  • ユーザー ID とユーザーが購入した製品 ID を含むテーブル 1B と、製品名にマッピングされた製品 ID を含む別のテーブルがあるとします。ワインやボトルオープナー、ポテトチップスやビールなど、同じユーザーが頻繁に一緒に購入するペア商品を見つけようとします。これらの共存する製品ペアの上位 100 個を見つけるにはどうすればよいでしょうか?
  • L1 正則化と L2 正則化の違い、特にモデルトレーニングプロセス自体への影響の違いについて詳しく説明してください。
  • 複数のサーバーに 100,000 個のファイルが分散しているとします。これらのファイルを Hadoop でどのように処理しますか?
  • Python と Scala の違いは何ですか?
  • LRU キャッシュについて説明します。
  • クライアントが毎分位置データを送信するクライアント サーバー モデルをどのように設計しますか?ある Hadoop クラスターから別のクラスターにデータを転送するにはどうすればよいですか?
  • Java のメモリにはどのような種類がありますか?
  • 何百ものタイトルのメタデータを同時に処理するという、毎日の面倒な作業をどのようにこなしていますか?
  • 境界構造によってコアが過負荷になり、コンピューターのエネルギーが地下ドーム内の過度に複雑なファイル システムにリダイレクトされるという、隠れた時間枠内で、データ フローとアクセス可能性の観点から成功を測定するにはどうすればよいでしょうか。
  • あなたが最も欲しいスーパーパワーは何ですか?
  • 次の読み取りを予測する時系列のセンサーがあります。
  • SQL を使用してスーパーマーケットの買い物かご出力を作成します。
  • 心理学の実践においてどのような経験がありますか? (研究ポートフォリオに基づく質問)
  • 特性評価におけるあなたの専門知識は何ですか? 一般的に何が使用されますか? それを研究でどのように使用し、興味深い結果を見つけますか? (研究ポートフォリオに基づく質問)
  • 障害解析はどのように行いますか?
  • バイナリ ツリーが左と右のサブツリーのミラー イメージであるかどうかを確認します。
  • ランダムフォレストとは何ですか? なぜナイーブベイズの方が優れているのですか?

要約する

トップテクノロジーを代表する 6 つのテクノロジー企業と、6 セットの面接質問。これらの質問セットから、各企業の異なる重点分野がわかります。まずは質問を集めて、ゆっくり勉強することをお勧めします。上記の面接の質問をしっかり勉強できれば、たとえこの6社に入れなかったとしても、国内のAI大手もあなたに門戸を開いてくれると信じています。未来はあなたの手の中にあります!

参考リンク

  • https://medium.com/acing-ai/microsoft-ai-interview-questions-acing-the-ai-interview-be6972f790ea
  • https://medium.com/acing-ai/amazon-ai-interview-questions-acing-the-ai-interview-3ed4e671920f
  • https://medium.com/acing-ai/facebook-ai-interview-questions-acing-the-ai-interview-5982add0af55
  • https://medium.com/acing-ai/google-ai-interview-questions-acing-the-ai-interview-1791ad7dc3ae
  • https://medium.com/acing-ai/uber-ai-interview-questions-acing-the-ai-interview-9532794bc057
  • https://medium.com/acing-ai/apple-ai-interview-questions-acing-the-ai-interview-803a65b0e795

<<:  データマイニングの分野でトップ 10 の古典的なアルゴリズムの 1 つ - K-Means アルゴリズム (コード付きで非常に詳細)

>>:  百度の商用グレードの無人バス「アポロ」が一般公開され、試乗が可能に

ブログ    

推薦する

Lightning AI Studioを無料で使う方法

翻訳者 |ブガッティレビュー | Chonglouこの記事では、無料で使いやすい新しいクラウドIDE...

インテリジェントな人間と機械のインタラクションがデジタルサービスを新たなレベルに引き上げます

2020年という「長い」年が、あっという間に終わりを迎えようとしています。この時期を振り返ると、長い...

ターゲット検出にはこの記事で十分です! 2019年版オブジェクト検出の総合ガイド

[[272485]]ビッグデータダイジェスト制作編纂者:張瑞怡、寧静コンピュータ ビジョンは、デジタ...

Google Robotics Research Scientist: ML 論文の要点を素早く理解するための 5 つの質問を覚えておきましょう

[[382214]]編纂者:Qi Lubei編集者:陳彩仙機械学習の分野は非常にホットであり、新しい...

米軍はU2に人工知能副操縦士を装備した。世界で最も操縦が難しい航空機は将来ドローンになるかもしれない

ロシアのスプートニク通信は12月17日、米空軍が最近、U2戦闘機の副操縦士として初めて人工知能を使用...

文化分野における人工知能の応用

近年、我が国の文化産業は人工知能などのハイテクをますます重視しており、文化と技術が深く有機的に融合す...

ディープラーニングの限界と将来

[[227297]]注: この記事は、Keras の作者である François Chollet に...

...

ローコード自動化が銀行業務をどう変えるか

基本的な当座預金口座の機能に関しては銀行間でほとんど違いがないため、各銀行は顧客にさらに多くの機能を...

米国の光学半導体ウエハ検査機はAIとビッグデータを統合し動作速度を3倍に向上

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

ニューラルネットワーク?決定木?できないよ!説明可能な AI を解決できるのは誰か?

この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...

中国の教授が犯罪認識率97%の人工知能「検察官」を開発、現在テスト中

[[442697]]最近、「中国の教授らが人工知能検察官を開発中」というニュースが多くの海外ネットユ...

...

今日のデータとAI市場における不確実性にどう対処するか

データ分析と人工知能 (AI) 市場に関するニュースをフォローしている人なら誰でも、過去数年間で多く...

UiPath: RPA の台頭が企業のデジタル化の青写真を描く

【51CTO.comオリジナル記事】 [[344118]]近年、ロボティック・プロセス・オートメーシ...