アリ側1. 自己紹介: 私はXXXの修士課程の学生で、機械学習を専攻しています。私の研究分野はディープラーニングです。また、私はXXXの学部生で、モノのインターネット工学を専攻しています。学部生として2つのプロジェクトに取り組みました。 (1)ビッグデータに基づく株式市場分析 (2)ユーザー操作に基づくレコメンデーションシステム 大学院時代に最も印象に残った2つのプロジェクトは次の通りです。 1) ロボット工学コースワークにおける課題 2) 現在取り組んでいるモデルベースのインテリジェント機械学習フレームワークについて、1)に焦点をあて、実際の作業内容や完成度、貢献度について質問しました。 *** はモノのインターネットについての意見を尋ねられました。 2. ハッシュマップの紹介 まず、JAVA のハッシュ マップの使い方を知っていると言いました。Python の辞書もハッシュ テーブルを使用して実装されています。まず、hash() を使用してキーと値をアドレスにマップします。キーと値をテーブル内の場所にマップすることでレコードにアクセスします。このクエリ速度は非常に速く、更新も高速です。このマッピング関数をハッシュ関数と呼び、値を格納する配列をハッシュテーブルと呼びます。 ハッシュ関数の実装によって、ハッシュ テーブルの検索効率が決まります。具体的な操作手順は以下のとおりです。 1) データの追加: キーはハッシュ関数を介して整数に変換され、次にその整数は配列の長さを法として計算されます。法の結果は配列の添え字として使用され、値は整数を添え字として配列スペースに格納されます。 2) データクエリ: ハッシュ関数を再度使用してキーを対応する配列インデックスに変換し、配列の位置を見つけて値を取得します。 ただし、キーをハッシュする場合、特にデータ量が増えると、異なるキーが同じハッシュ結果を持つことがあります。この問題はハッシュ競合と呼ばれます。この対立をどう解決すればいいのでしょうか?一般的なアプローチは 2 つあり、1 つはリンク メソッド、もう 1 つはオープン アドレス指定メソッドです。Python では後者を選択します。 オープンアドレス指定: オープン アドレッシング方式では、すべての要素がハッシュ テーブルに格納されます。ハッシュの競合が発生すると、検出機能を使用して次の候補位置を計算します。次に選択された位置でも競合が発生する場合は、検出機能を使用して下方向に検索し、挿入する要素を格納するための空きスロットが見つかるまで検索します。 3. アルゴリズム: クイックソートの時間計算量と空間計算量はどれくらいですか?平均はいくらですか?最悪なことは何ですか?時間の計算量が O(nlogn) である他のソート操作はありますか? ソートの安定性について何かご存知ですか?私: クイックソートの時間計算量は O(nlogn)、空間計算量は O(1)、平均は O(nlogn)、最悪は O(n^2) で、バブルソートに退化することをはっきり覚えています。また、ヒープソートとマージソートの時間計算量も O(nlogn) です。ソートの安定性は、ソート前には 2 つの要素 A1 と A2 があり、A1 が A2 の前にあることです。ソート後も、A1 は A2 の前にあります。 4. SVMとロジスティック回帰の比較:まず、y = wx + bの結果をシグモイド関数に入れて、シグモイドを分類器として使用するロジスティック回帰のプロセスを紹介しました。これは、シグモイド関数が区間(0、1)内のすべての範囲の値の範囲を制御できるためです。次に、0.5を分類しきい値として使用し、0.5より大きい値は陽性クラスに分類され、0.5未満の値は陰性クラスに分類されます。 SVM は、超平面を使用してデータを分離および分類する問題です。まず、平面に最も近いすべてのポイントのマージンを最大化し、y(wx+b)>0 を条件とします。これは分類が正しいことを意味します。 次に、最も近い点から平面までの距離を取得します。 次に、ラグランジュの乗数公式を使用して、条件の主題を w、b を解く方程式に変換し、最適な超平面を見つけます。 SVM には多くのカーネルがあり、それは規制のようなものだと言いました。面接官はそれが間違っていると言いました。カーネルとは何であり、何に使用されるのか教えていただけますか?カーネルは低次元から高次元にデータをマッピングするものであると述べました。一部のデータは低次元では分離できないため、高次元にマッピングすると、データを分割する超平面を見つけることができ、より正確になります。 ***前述のように、LR は計算が簡単ですが、SVM 高次元カーネルは計算が複雑ですが、より正確です。データ量が多くリアルタイムの予測結果が必要な場合はLRを使用し、データ量が少なく精度が必要な場合はSVMを選択します。さらに、SVM は多重分類に使用できますが、LR はバイナリ分類にのみ使用できます。 5. 過剰適合と規制への解決策: 規制に関しては、先ほど要約しましたが、主に次の 2 つの点についてお話ししました。 (1)ドロップアウト:ドロップアウトの概念を紹介し、トレーニング段階とテスト段階におけるさまざまなプロセスの詳細について質問します。 重要な点は、テストがアクティブ関数の出力に P を掛けることで、トレーニングとテストの出力期待値が範囲に合わせてスケーリングされ、より正確になることです。 (2)バッチ正規化:BN。BNの原理は何ですか?その利点は何ですか? 1) サンプル間の差を減らして(0, 1)にスケールします。 2) レイヤー間の依存性が軽減されます。これは主に、前のレイヤーの出力が次のレイヤーの入力になるという事実に反映されています。すべてのデータを (0, 1) 分布にスケーリングすると、レイヤー間の依存性が軽減され、データの精度が向上します。 会話は1時間続き、私は完全に唖然としました。一次面接は履歴書面接ではないのですか? (内心。***は面接官に2つの質問をしました。1)上司に仕事を報告して帰る途中、電話が鳴りました。準備ができていないと言い、面接官に私に対する評価を尋ねました。面接官はとても親切で、私の基礎は良いと言って、肯定的な評価をしてくれました。2)面接官に彼の部署の仕事の内容について尋ねたところ、たくさん話してくれました。それから彼は、後で誰かが連絡してくるかもしれないし、誰も連絡してこないかもしれない、もし誰かが連絡してくるとしたら、それは彼の同僚かもしれない、と言いました。 2番目の面1. 自己紹介とプロジェクトの紹介: 主に TensorLayer フレームワークの作成と貢献について紹介します。詳細が非常に詳細だったため、面接官は質問しようとしていたことはすべて話したと言っていました。 2. 基礎調査: 1. 知覚の領域を知っていますか?機能は何ですか?畳み込みが何をするのか知っていますか?プーリングレイヤーを使用しましたか?彼らは何ですか? その時は完全に混乱しました。感覚野とは何でしょうか? *** 複数のカーネルが畳み込みを実行している場合、受容野は実際にはウィンドウ領域であることが再度確認されました。つまり、3 倍の 33 は 1 倍の 77 に等しくなります。 畳み込みの機能は特徴を抽出することです。前者の畳み込みは人間の目が認識できるものと同様の予備的な特徴を抽出しますが、後者の畳み込みは検出がより困難であるが実際に存在する特徴を抽出できます。 使用されるプーリングには、最大プーリング、平均プーリング、およびグローバル平均プーリングが含まれます。これら2つの用途は何ですか? 最大プーリングは最も特徴的な特徴を抽出すると愚かにも言っていますが、実際には最も代表的な特徴です。平均プーリングはより一般的な特徴を抽出します。グローバル平均プーリングは分類に使用されます。ネットワークが後で深くなるにつれて、完全接続層のパラメータが多すぎて、トレーニングが容易ではありません。結果を迅速かつ正確に得るために、パラメータなしでグローバル平均プーリングが使用されますが、分類効果は FC に似ています。 2. ちょっと変ですね。クローラーを作ったとおっしゃっていましたが、自分で書いたのですか、それともフレームワークを使ったのですか? 私が使用したフレームワークは、基本的に今は Java を使用していません。まだ補う必要があると思います。ほとんどすべてを忘れてしまいましたが、私が行ったのは、Xpath を使用してクロールされた要素を見つけ、それらを保存し、スクリプトを使用してそれらを Jason に変換して使用することでした。 3. あなたは機械学習を学んでいる学生です。シーケンスからシーケンスまで知っていますか? 私の最初の反応は RNN でした。私は RNN を理解しておらず、ディープラーニングの CNN 関連の仕事しかやったことがないと言いました。上司は笑って、基礎を磨く必要があると言いました。 4. オンラインプログラミング: ここに答えるべき質問があります。数学の平方根法を使用せずに、自然数を二乗できるかどうかを判断してください(可能な限り低い時間計算量で)。 ああ、*** はバイナリ検索に反応します。 最初にブール値を書いて、それを削除し、def を作成して関数を書き始めました。 *** は 2 つの質問をし、彼は私にさらに 2 つの質問をしました: (1) (今回は P8 の人でした) 杭州では、どこで仕事をするか気にしますか? (私はさらにいくつかの言葉を話し、いくつかの本当の批判をぶつけました。) (2) tensorlayer の貢献者として、Kreas に対するあなたの利点は何ですか? Kearsはcaffe2、Pytorchなど、下層のライブラリを多数サポートしているとのこと。私はTensorLayerは出発点が違うと答えました。比較した結果、それは非論理的だと感じ、面接官から機械学習の知識を広げる必要があるというフィードバックをもらったので運が悪かったと感じました。機械学習をやっている人間にしては、このような批判を受けました。 。 。 3つの側面コース全体は 50 分間続き、主にプロジェクトに焦点が当てられ、プロジェクトのためにいくつかの最適化問題が提起されました。 1. 自由に調整できる事前トレーニング モデルの場合、出力の前の部分のチェックポイント パラメーターとモデル構造が一緒に固定され、新しいタスクで適切に機能するようにするにはどうすればよいでしょうか。これを裏付ける実験データはありますか? 2. depthwise-CNN をご存知ですか?具体的な原理を説明していただけますか? 1*1 カーネルの役割は何ですか?ネットワーク モデルにどのような影響がありますか? 3. 他にどのような従来の機械学習アルゴリズムを知っていますか、または学んだことがありますか? XGBoost?ふーむ? SVMなどについては理解していますか? 4. どのような基本的なアルゴリズムを学びましたか?データ構造をどのように使用するのですか? 5. 出身はどこですか?ホームタウン?出身地は? 6. 大学での経験、将来の計画、働く理由について尋ねられましたか?彼は私がまず働きたいと思っていることを察し、後で博士号を取得したいかどうか尋ねました。 交換問題、 1. 面接官の仕事内容。 2. 自分に対する評価と提案:短期間で自分の最も輝ける部分をアピールする(翌日に第4次面接に行き、通知を待つ)。 |
<<: 機械学習とAIを活用してAPIベースのセキュリティソリューションを開発
>>: トレンド | 今後 10 年間の機械学習研究のホットスポット
テクノロジーは建設業界にかつてないほど大きな影響を与えています。クラウドベースのコラボレーションやデ...
モノのインターネットは長い間、インターネットの第2フェーズとして宣伝されてきましたが、現在、コロナウ...
この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...
[[414747]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitA...
クラウド コンピューティング サービス プロバイダーの Rackspace Technology が...
昨日、北京のマイクロソフトビルでSmarterが開催されました。カンファレンスのテーマは「インテリジ...
人工知能プロジェクトに着手する企業の多くは素晴らしいビジネスアイデアを持っていますが、企業の AI ...
量子コンピューティングと人工知能の融合により、大きな期待と可能性を秘めた研究の最前線である量子人工知...
[[378826]]本田技術研究所では、エキスパートナレッジシステムを活用して車体設計プロセスに A...
[[184562]]企業への人工知能の浸透はまだ始まったばかりですが、すでにビジネスリーダーたちは...