Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

ビッグデータ概要

編纂者:張南星、魏青、銭天培

マイクロソフトのような大企業は、どのような AI 人材を雇用できるのでしょうか?

AlphaGo を手書きで書ける天才になる必要があるのでしょうか? それとも、鋭い観察力を持ち、今後 20 年間の AI の発展の見通しをその場で想像できる必要があるのでしょうか?

もちろん違います!

今日、Wen Zhai Jun は Microsoft AI 面接の質問をいくつか見つけ、最も基本的な回答をしました。 (これは最も基本的な回答であることに注意してください。より良い回答を得るために、記事の最後にメッセージを残していただいても結構です。)

謎に包まれた Microsoft AI の面接の質問は、実は非常に取り組みやすいものです。一緒に答えてみましょう!

k 個のシーケンス(たとえば k=2)を結合して並べ替える

コードは上記の通りです。最も簡単な方法は、もちろんバブルソート法です。最も効率的ではありませんが、説明と実装は簡単です。

L1/L2 正則化メトリックの違いは何ですか?

L1 ノルム損失関数は、最小絶対差 (LAD) および最小絶対誤差 (LAE) とも呼ばれます。主な目的は、目標値 (y_i) と予測値 (f(x_i)) の絶対差の合計を最小化することです。

フォーミュラ1

L2 ノルム損失関数は、最小二乗誤差 (LSE) とも呼ばれます。これは主に、目標値(Yi)と予測値[f(xi)]の差の二乗の合計を最小化することにあります。

フォーミュラ2

エラーが大きい場合、L2 は L1 よりも大きなペナルティを与えます。さらに、L2 正則化を追加すると、モデル係数は 0 に収束しますが、完全にゼロにはなりません。一方、L1 損失関数では、一部の係数が完全にゼロになる可能性があります。

パーセンタイルを見つけるにはどうすればいいですか?

上記の質問を例に挙げてみましょう。過去 12 時間に、このショッピング モールを訪れた人は合計 1,000 人です。ショッピング モールの顧客数が全体の 30% に達したのはいつ頃でしょうか。

多項式回帰やスプライン平滑化などの手法を使用して、次の図を作成できます。

つまり、乗客数の30%は3,000人に相当します。

Y 値が 3000 の点から水平線を描きます。曲線と交差するときに垂直線を描き、水平軸上の対応する時間値を見つけます。

良い視覚化と悪い視覚化をどのように区別するのでしょうか?

この質問に対してはさまざまな答えがあるでしょう。たとえば、外れ値を適切に処理しない視覚化は、適切な視覚化とは言えません。

たとえば、一連の小さな数字の中に大きな数字が含まれる配列 ([1,2,3,4,7777,5,6,9,2,3]) がある場合、この配列を視覚化すると、次の図が表示されます。

右画像 → オリジナル画像、中央画像 → 正規化値、左画像 → 標準化値

このデータをより良く視覚化するにはどうすればよいでしょうか? 上の図に示すように、分析値を標準化または正規化しても、結果として得られる折れ線グラフではこの配列を適切に表現できません。私たちは何をすべきでしょうか? お気軽にメッセージを残してご意見をお聞かせください。

逆行列をより速く計算するにはどうすればいいでしょうか?

例えば、ガウス・ジョルダン法が考えられます。

2x2 行列であれば非常に簡単です。

逆行列は次のようになります。

ad-bc≠0

a と b を入れ替え、b と c の負数を取って、正方行列 ad-bc で割ります。

差異の定義

分散は、各データ ポイントとデータ セット全体の平均との差の二乗の合計です。言い換えれば、それはデータの変動性です。次の図は、分散が何であるかを非常によく説明しています。

まず、各犬の身長と平均身長の差を計算します。分散を計算するには、各差を二乗して合計し、平均を求めます。

最後に、この記事に登場するすべてのコードを以下に示します。

https://colab.research.google.com/drive/1DYimC5CEKeXdT15tbptifYL2v5MPkyHj

関連レポート:

https://towardsdatascience.com/my-take-on-microsoft-ai-interview-questions-with-interactive-code-part-1-c271388af633

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  畳み込みニューラル ネットワークの設計を始めたいですか?これは包括的なデザインガイドです

>>:  Scikit-learn をご存知ですか?これらの機能をご存知ですか?

ブログ    

推薦する

...

...

AI時代の従業員のスキルアップのための5つのヒント

AI によって人々の働き方が変化する中、企業は従業員が自動化された職場環境に能力を適応できるように支...

データ構造フレームワークの考え方を理解すると、すべてのアルゴリズムは単なる張り子の虎に過ぎない

1. データ構造の保存方法データ構造を保存する方法は、配列 (順次ストレージ) とリンク リスト (...

RPAとは何ですか?ビジネスプロセス自動化の革命

CISO は、日常的なタスクを排除し、従業員がより価値の高い仕事に集中できるようにするために、ロボ...

人工知能とメタバースの関係を探る

AI とメタバースのつながりは、新たなデジタルのフロンティアを開拓しています… Metaverse ...

パンデミックにより、AI のステータスは「欲しいもの」から「必須のもの」に変化したのでしょうか?

パンデミック以前は、AIの導入は世間の関心を集めていたものの、人々はまだAIの長所と短所、ビジネスへ...

人工知能プロジェクト: 注目すべき 7 つのポイント

最近、業界調査会社ガートナーは、AI プロジェクトの 85% は CIO に引き渡されないという大胆...

生成 AI とデータ品質は共存できますか?

このハイテク時代では、生成型人工知能については誰もが知っているか、少なくとも聞いたことがあると思いま...

二分木反復アルゴリズム

バイナリ ツリーの事前順序、イン順序、および事後順序のトラバーサルは、アルゴリズムとデータ構造におけ...

...

ByteDance Wanka Cluster の技術詳細が明らかに: GPT-3 トレーニングが 2 日間で完了、コンピューティング パワーの使用率は Nvidia Megatron-LM を上回る

Sora のテクノロジーの分析が進むにつれて、 AI インフラストラクチャの重要性がますます明らかに...

...

機械学習を活用して産業オペレーションにおける運用リスクを管理する

センサーデータは、産業オペレーションにおける運用の安全性と効率性を確保する上で重要な役割を果たします...