AIに取り組んでいる学部生がオンラインでクラッシュ:GitHubモデルの実行に3か月かかり、難しすぎる

AIに取り組んでいる学部生がオンラインでクラッシュ:GitHubモデルの実行に3か月かかり、難しすぎる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

「機械学習って難しい!」

「GitHub モデル コードを動作させるのに 3 か月かかりました。もうダメです!」

「博士課程の学生たちとミーティングをしなくてはいけない。怖い!」

そんな必死の声をあげたのは、もともと機械学習の興味グループに熱心に参加していた学部だった。

しかし、MLに入ると、まるで深海にいるかのように何も制御できない状況に陥るとは誰が想像したでしょうか。

Reddit上の「苦情」がネットユーザーから大きな注目を集めた。

とても興味があります。

学部生が主流の機械学習に触れました。どんなクレイジーなことが起こったのでしょうか?

なぜ ML はこの学部生にこれほどの苦痛を与えたのでしょうか?

これは「痛い」話です。

当初、この学部生は「機械学習グループ」に参加することを志願し、その後、博士課程の学生を支援するよう任命された。

昨年9月から、博士課程の学生から「ナレッジグラフ」に関するいくつかの課題が与えられ、実装するように依頼された。

[[379356]]

問題はここから始まるのです。

この学部生が GitHub 上のいくつかのモデルのコードを実行するのに、丸 3 か月かかりました。

それだけでなく、彼は次のようにも不満を述べた。

それまでは、前処理と評価のコードを理解するために数え切れないほどの時間を費やしました。

結果はどうですか?

この ML コードを実行する方法がまだわかりません。

[[379357]]

彼はすでに非常に苦しんでいたが、さらに悲惨なことがこんなに突然起こるとは思っていなかった。

博士課程の学生は彼に「次のレベルに進む」ように、つまり論文にある同様の機能を実装した別の GitHub リポジトリを見つけるように依頼しました。

そこで、大学生は既存のコードを差し込んだのですが、結果はご想像のとおり、めちゃくちゃになってしまいました。

その場で爆発しろ!

すべての手順を実行しましたが、どこに問題があるのか​​わかりません。

[[379358]]

もう我慢できない、「もう無理」…

彼は今、毎週の医師との面談を恐れている。「もう報告できるほどの進歩はないだろうとわかっているからだ」

しかし、彼は自分の失敗から学び、学部生としてRedditで「魂を問う質問」をした。

機械学習コードは本質的にそれほど難しいのでしょうか?

私の脳に何か問題があるのでしょうか?

どうやってやったんですか?

何が問題なの?

「1週間の作業を経ても、問題は1つも解決されていません。報告する進捗はありませんか?」

ネットユーザー@santiagobmx1993が解決策を提案しました。実験の期限に応じて、学部生は遭遇した問題を解決する時間を素早く設定できます。課題を完了できない場合は、同じレベルまたはより上のレベルの人に助けを求めて、効率を素早く向上させることができます。

たとえば、1 日かけて課題を完了できなかった場合は、同じレベルの学部生を探して、その課題の解決を手伝ってくれる人を探すのにさらに 5 時間かかります。それでも解決しない場合は、博士課程の学生または指導教官を探して、さらに 2 時間かけて課題を解決してみてください。

[[379359]]

「手順を繰り返しても、何が問題なのかわかりません。」

ネットユーザー@help-me-growは、科学研究実験においては助けを求めることが重要だと考えている。時には、経験豊富な人なら、自分では気付かない問題に気付くこともあります。

ネットユーザーの@linverlanさんも、博士課程の学生として、コミュニケーションが非常に重要だと考えています。彼にとって、学部生のアシスタントがコードのデバッグを完了したり、問題を解決したり、より興味深い仕事に切り替えたりするのを手伝うことは、すべてコミュニケーションを通じて達成できるのです。

「研究の範囲外の課題を任され、他の人より大きく遅れをとることになる?」

ネットユーザーの@starfriesは、この学部生は、達成感を感じられるよう、得意な課題を見つける必要があるかもしれないと語った。そうでなければ、学部生に博士課程の学生だけが達成できる課題が割り当てられると、当然困難になります。

「コードはコンパイルできるのですが、実行すると失敗します。」

ネットユーザーの @todeedee は、基本的なスキルとしてユニットテストの学習を提案しました。

機械学習モデルをデータ収集コード、ネットワークコード、トレーニングコードに分解し、さらにコードを 5 行から 25 行の小さなモジュールに分割して個別にデバッグすると、問題をできるだけ早く見つけることができます。

[[379360]]

「コードを渡されたのですが、まったく理解できません。これは私の問題でしょうか?」

ネットユーザーの@milkteaoppaは、コードの品質が非常に低く、理解するのも難しいため、コードを実行できないと考えています。

機械学習コードを実行したいだけであれば、低品質のコードを識別し、博士課程の学生とコミュニケーションをとってコードの品質を向上させることを学ぶ必要があります。

「学部生として、コードのデバッグには問題ないのですが、機械学習のコードのデバッグには全く問題がないのでしょうか?」

ネットユーザーの@TachyonGunは、機械学習のコードは数学など多くの必要な知識を習得する必要があるため、学部生にとっては本当に難しいと考えています。コードをデバッグすると、特異行列、数値安定性など、多くの数値問題が発生します。

したがって、機械学習コードを実行する場合は、まず数学的知識(数値解析、応用線形代数、数学的モデリング、確率論/高度な統計)を習得し、手法(数値化手法と視覚化手法)を習得する必要があります。

実際、科学研究に携わるネットユーザーも、この学部生が直面している困難に共感できるはずだ。

1か月間実験に熱心に取り組んだにもかかわらず、進捗状況を報告できず、上司から容赦なく批判されました。

論文のコードを再現したかったのですが、「コードエラー、コンパイルエラー、環境コードが合わない」などの問題を解決するだけでかなり時間がかかってしまいました...

しかし、まさにこのため、彼らは対応する経験を蓄積し、学部生が適切な解決策を見つけるのを支援しました。

"ご協力いただきありがとうございます"

ネットユーザーの助けを借りて、その学部生は落ち着きを取り戻し、ネットユーザーから寄せられた提案を注意深くまとめた。

彼は、博士課程の学生や他の研究者とのコミュニケーション不足、プロジェクトの実行方法の理解不足、さらに機械学習モデルとパラメータ設定に関する理論的な知識の欠如が、失敗の原因であることを突き止めました。

もちろん、彼は渡されたコードが実際には低品質であることも認識していました。読みにくいだけでなく、モジュールが非常に断片化されていて、統合するのが困難でした。

彼は博士課程の学生と話し、自分が遭遇した問題を告白することにした。

しかし、学部生であれば、卒業プロジェクトに取り組んでいる場合でも、研究室で働いている場合でも、この「ポスター」と同じような混乱に多かれ少なかれ遭遇するでしょう。

すぐに開始してパスを入力する方法はありますか?

清華大学特別賞受賞学部生の秘密

実際、学部生の中にはすでに 4 本の論文を持っている人もいます。

これは、清華大学特別賞を受賞したGao Tianyu氏の実際の体験です。彼が発表した 4 つの論文はすべて、トップクラスの AI カンファレンスで発表されました。そのうち 2 つは AAAI、2 つは EMNLP です。

[[379361]]

彼もこれらの科学的研究結果について何か言いたいことがあるようですが、それらはすべて共有すべき実用的で有用な情報です。

たとえば、Gao Tianyu 氏は、この大学生が挫折する原因となった、多くの人が話すのが難しい「先延ばしのプレッシャー」を軽減する方法を示しました。

高負荷の実験を行うことが多い学生は、忙しいときにタスクを切り替えることができ、また、日々の作業を記録することで、先延ばしによる心理的プレッシャーを軽減することもできます。

さらに、一見直感に反する提案として、物事を明日まで先延ばしにするというものがあります。これは先延ばしを奨励するためではなく、忙しい日々から離れて考えることができるようにするためです。明日はもっと良い解決策があるかもしれません。

[[379362]]

高天宇氏はまた、学生は指導者や先輩たちともっとコミュニケーションを取るべきだと提案した。

彼らは過去の研究をより深く理解しており、実験の経験も豊富であるため、多くの回り道をせずに済みます。

もちろん、機械学習の基礎理論を強化したい場合、Gao Tianyu は論文を素早く読む方法も紹介しています。

ほとんどの論文では、概要を読んですぐに分類するだけで済みます。本当に役立つと思われる場合は、次の構造に従って分析してください。

  • 要約: 研究の意義(先行研究、研究上の欠陥を含む)、研究方法、研究結果
  • はじめに: 多くの大きな真実 (どのような問題が解決されたか)
  • 関連研究: 文献レビュー
  • 方法: 詳細
  • 実験: 顔面叩き(論文の試金石)
  • 結論: 基本的に役に立たない (繰り返し要約)

ドキュメント管理ツールも必要です。

Nature: 「学部研究者」になるための3つのステップ

ネイチャー誌は、高天宇氏の個人的な「秘密」に加えて、「科学研究を行っている学部生」に関する記事も掲載している。

ネイチャー誌は記事の中で、学部生が科学研究プロジェクトに参加することはトップクラスの大学では一般的な現象だと指摘した。

具体的には、例えば MIT ではその割合が90% を超えています

教室で授業を受けることから研究室での生活に移るのは、確かに大きな変化です。

この点に関して、Nature は、この変容プロセスにおいて、個人は通常3 つの段階を経ると考えています (すべての人に当てはまるわけではありません)。

第一段階は「理解せずに科学研究を行う」ことです。

到着したばかりの学部生にとって、最初の質問は間違いなく何をすべきかということです。

いくつかの実験も行われていますが、その理由やその背景にある性質は特に明らかではないかもしれません。

第二段階は「理解に基づいた科学的研究の実施」です。

ネイチャー誌は、この州で科学研究を行う学生は、研究室が保持したい人材であることが多いと述べている。

彼らは実験の限界を観察するために、研究室の外でより多くの時間と経験を積むことになります。これは、チームとの関わり合いの意識を育むのに役立ちます。

3番目の段階は「学生の研究」です。

この段階の学生は研究者のように考えます。つまり、新しい質問や仮説を立て、それらをテストするための新しい実験を計画するなどです。

Nature は、この段階の学生が研究室に最大の貢献をすると考えています。

さらに、ネイチャー誌は、時間管理、研究と休息のための適切な時間、批判的な読書、記録を残す習慣など、いくつかの詳細な提案も提示した。

最後に、これを経験している人、または経験したことがある人として、同様の問題に遭遇したことがありますか?

<<:  顔認識が「トレンド」になったら、少なくとも私たちには選択する権利があるはずです。

>>:  機械学習とディープラーニングの違いを簡単に分析する

ブログ    
ブログ    

推薦する

7つの変革的技術トレンド:第4次産業革命をリードする

テクノロジーは常に進化し、私たちの未来を形作っています。第四次産業革命は、さまざまな産業に革命をもた...

ツイッターがマスク氏の買収を阻止:15%以上の株式を保有する者は割引価格で発行される

イーロン・マスクによるツイッター買収のドラマもついにこの回まで来た。ツイッターは現地時間4月15日、...

...

AIoT = AI + IoT、舞台裏で誰が誰をもっと必要としているのでしょうか?

AIoTとは何でしょうか?多くの人にとって「AI+IoT」が答えになると信じています。昨年初めから...

...

...

WaymoとGoogleが自動運転のマルチ軌道行動予測を実現するTNTモデルを提案

はじめに: Waymo は最近、フェニックス地域で安全担当者なしの無人タクシーの運行を開始すると発表...

中国の人工知能コンピューティングパワーレポート:インターネット産業への投資が最も多く、都市ランキングでは杭州が1位

「中国の人工知能の応用と商業化の探究は世界と同レベルだが、コンピューティングパワー、アルゴリズム技術...

...

アルゴリズム調整、難易度がさらに7.3%上昇、ビットコイン採掘難易度は「回復」継続

ルールによれば、ビットコインは2016ブロックごと、つまり約2週間ごとにマイナーの難易度をリセットし...

クリスマスのギフトボックスにロボット犬を見つけますか?ボストン・ダイナミクスがイースターエッグをリリースしたが、ギフトボックスが逃げてしまった

クリスマスが近づいてきました。ボストン ダイナミクスから特別なクリスマス ギフトをお届けします。昨日...

CNNを知っておくべきだ

CNN というと、最初は特定のテレビ局を思い浮かべる人が多かったのですが、数年後にはディープラーニン...

USTCのニューラルネットワークとエンドツーエンドのトレーニングフレームワークは、教育環境が学生の能力に与える影響を調査する

[[424271]]中国科学技術大学の研究者らは、教育コンテキスト認識型認知診断フレームワークを提案...

TikTokの背後にあるAIの仕組み

TikTok は、ユーザーが短い動画を作成して共有できる動画共有アプリです。 「あなただけのための」...