Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

Microsoft AI の面接の質問はどれくらい難しいですか?サンプルロールはこちら

ビッグデータ概要

編纂者:張南星、魏青、銭天培

マイクロソフトのような大企業は、どのような AI 人材を雇用できるのでしょうか?

AlphaGo を手書きで書ける天才になる必要があるのでしょうか? それとも、鋭い観察力を持ち、今後 20 年間の AI の発展の見通しをその場で想像できる必要があるのでしょうか?

もちろん違います!

今日、Wen Zhai Jun は Microsoft AI 面接の質問をいくつか見つけ、最も基本的な回答をしました。 (これは最も基本的な回答であることに注意してください。より良い回答を得るために、記事の最後にメッセージを残していただいても結構です。)

謎に包まれた Microsoft AI の面接の質問は、実は非常に取り組みやすいものです。一緒に答えてみましょう!

k 個のシーケンス(たとえば k=2)を結合して並べ替える

コードは上記の通りです。最も簡単な方法は、もちろんバブルソート法です。最も効率的ではありませんが、説明と実装は簡単です。

L1/L2 正則化メトリックの違いは何ですか?

L1 ノルム損失関数は、最小絶対差 (LAD) および最小絶対誤差 (LAE) とも呼ばれます。主な目的は、目標値 (y_i) と予測値 (f(x_i)) の絶対差の合計を最小化することです。

フォーミュラ1

L2 ノルム損失関数は、最小二乗誤差 (LSE) とも呼ばれます。これは主に、目標値(Yi)と予測値[f(xi)]の差の二乗の合計を最小化することにあります。

フォーミュラ2

エラーが大きい場合、L2 は L1 よりも大きなペナルティを与えます。さらに、L2 正則化を追加すると、モデル係数は 0 に収束しますが、完全にゼロにはなりません。一方、L1 損失関数では、一部の係数が完全にゼロになる可能性があります。

パーセンタイルを見つけるにはどうすればいいですか?

上記の質問を例に挙げてみましょう。過去 12 時間に、このショッピング モールを訪れた人は合計 1,000 人です。ショッピング モールの顧客数が全体の 30% に達したのはいつ頃でしょうか。

多項式回帰やスプライン平滑化などの手法を使用して、次の図を作成できます。

つまり、乗客数の30%は3,000人に相当します。

Y 値が 3000 の点から水平線を描きます。曲線と交差するときに垂直線を描き、水平軸上の対応する時間値を見つけます。

良い視覚化と悪い視覚化をどのように区別するのでしょうか?

この質問に対してはさまざまな答えがあるでしょう。たとえば、外れ値を適切に処理しない視覚化は、適切な視覚化とは言えません。

たとえば、一連の小さな数字の中に大きな数字が含まれる配列 ([1,2,3,4,7777,5,6,9,2,3]) がある場合、この配列を視覚化すると、次の図が表示されます。

右画像 → オリジナル画像、中央画像 → 正規化値、左画像 → 標準化値

このデータをより良く視覚化するにはどうすればよいでしょうか? 上の図に示すように、分析値を標準化または正規化しても、結果として得られる折れ線グラフではこの配列を適切に表現できません。私たちは何をすべきでしょうか? お気軽にメッセージを残してご意見をお聞かせください。

逆行列をより速く計算するにはどうすればいいでしょうか?

例えば、ガウス・ジョルダン法が考えられます。

2x2 行列であれば非常に簡単です。

逆行列は次のようになります。

ad-bc≠0

a と b を入れ替え、b と c の負数を取って、正方行列 ad-bc で割ります。

差異の定義

分散は、各データ ポイントとデータ セット全体の平均との差の二乗の合計です。言い換えれば、それはデータの変動性です。次の図は、分散が何であるかを非常によく説明しています。

まず、各犬の身長と平均身長の差を計算します。分散を計算するには、各差を二乗して合計し、平均を求めます。

最後に、この記事に登場するすべてのコードを以下に示します。

https://colab.research.google.com/drive/1DYimC5CEKeXdT15tbptifYL2v5MPkyHj

関連レポート:

https://towardsdatascience.com/my-take-on-microsoft-ai-interview-questions-with-interactive-code-part-1-c271388af633

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  畳み込みニューラル ネットワークの設計を始めたいですか?これは包括的なデザインガイドです

>>:  Scikit-learn をご存知ですか?これらの機能をご存知ですか?

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

新たな勢力が市場に参入、コンパイラーの巨匠クリス・ラトナーが自らのビジネスを始める

「私たちのチームは、世界最大かつ最先端のテクノロジー企業出身者で構成されています。世界クラスの才能あ...

...

北京、上海、深セン、杭州、中国の人工知能産業のリーダーは誰でしょうか?

人工知能企業は主に北京、上海、深セン、杭州に分布している中国新世代人工知能開発研究所のデータによると...

...

eSIM テクノロジーはどのようにしてグローバル BVLOS ドローンの運用を簡素化できるのでしょうか?

近年、ドローンは農業から物流、世界的な軍事作戦まで、多くの産業に革命をもたらしました。 これらの飛行...

「無人農業」は除草ロボットの導入も開始

農業は、国の経済発展における主要産業として、国民経済の重要な一環であり、常に国民経済の建設と発展を支...

機械学習と人工知能の未来について語る

[[258702]] [51CTO.com クイック翻訳] 機械学習 (ML) と人工知能 (AI)...

OpenAI と Mistral AI によって人気を博した MoE の背景にあるストーリーとは?ハイブリッドアーキテクチャの導入に関する包括的なガイド

専門家の混合 (MoE) は、LLM の効率性と精度を向上させるためによく使用される手法です。このア...

ChatGPT でより良いコードを書く方法

翻訳者 |李睿レビュー | Chonglouコードの生成は、ChatGPT や指示に従うその他の大規...

AI採用を本当に公平にすることは難しいかもしれない

アマゾンのAI採用ツールが女性差別をしていたことが発覚し、公式がチーム解散を発表。これで一件落着か?...

...

LLMLingua: LlamaIndex を統合してプロンプトを圧縮し、大規模な言語モデルに効率的な推論を提供します。

大規模言語モデル (LLM) の出現により、複数の分野でイノベーションが促進されました。しかし、思考...