Google Robotics Research Scientist: ML 論文の要点を素早く理解するための 5 つの質問を覚えておきましょう

Google Robotics Research Scientist: ML 論文の要点を素早く理解するための 5 つの質問を覚えておきましょう

[[382214]]

編纂者:Qi Lubei

編集者:陳彩仙

機械学習の分野は非常にホットであり、新しいモデルやテクノロジーが絶えず急速に更新されているため、私たちは日々の仕事や勉強の中でいくつかの論文を読み、特定の分野の最新の動向を追跡する必要があります。

しかし、論文を読むときに、忘れやすいということと、要点をつかみにくいということの 2 つの不快感を感じることがよくあります。 忘れるというのは、通常、後半部分を読んだ後に前に読んだ内容を忘れてしまうこと、または数日後に読んだ論文を振り返ってみて、それが何についてのものだったのか全く思い出せなくなることを意味します。 要点を把握できないことは、論文を全体的な視点から研究することに重点を置かず、逐語的に読むことを好むことに反映されています。

では、機械学習分野の論文はどのように読めばいいのでしょうか?

Google Robotics の研究科学者 Eric Jang 氏は、自身のブログに「機械学習の論文を素早く理解する方法」という記事を投稿し、学生から「arXiv には毎日たくさんの論文が掲載されていますが、どうしたら選択的に読むことができますか?」といった同様の質問を受けることが多いと述べています。

彼は、機械学習分野のほとんどの論文を読むことの利点は、論文の論理を理解するために 5 つの簡単な質問をするだけでよく、難しい用語や数学的導出の不備など、多くのトラブルを回避できることだと示唆しました。

5つの質問は次のとおりです。

1. 関数近似器への入力は何ですか?

たとえば、1 つのオブジェクトのみが中央に配置された 224x224x3 RGB ビュー。

2. 関数近似器の出力は何ですか?

たとえば、これは入力長が 1000 ベクトルの画像に対応します。

機械学習システムの入力と出力をこのように「楕円形」の方法で考えると、アルゴリズムの用語を飛ばして、他の分野で同じ目標が他の方法で達成されているかどうかを検討することができます。 「メタ学習」の分野の論文を読むときに、このアプローチが非常に役立つことがわかりました。

機械学習の問題を入力と予想される出力のセットとして見ると、入力が出力を予測するのに十分かどうかを推論できます。この演習を行わないと、入力によって出力が決まらないランダムな機械学習の問題が発生する可能性があります。そのため、「エラー」を誘発する機械学習システムを作成することが可能です。

3. 出力の予測はどのようなコストで監視されますか? この特定の目標は世界についてどのような仮定を立てますか?

機械学習モデルは、バイアスとデータを組み合わせて形成されます。偏見は強い場合もあれば弱い場合もあります。モデルの一般化を向上させるには、バイアスをさらに追加するか、バイアスのないデータをさらに追加する必要があります。 「ただのランチはない」理論が指摘するように、優れたモデルは簡単には作れません。

一例を挙げると、多くの最適制御アルゴリズムは、安定した連続的なデータ生成プロセス、つまりマルコフ決定プロセス (MDP) を想定しています。 MDPでは、環境の遷移を通じて「状態」と「アクション」が「次の状態、フィードバック、終了するかどうか」に動的にマッピングされます。この構造は非常に一般的ですが、学習した Q 値がベルマン方程式に従うように損失を定式化することができます。

4. トレーニング後、モデルはこれまで聞いたことのない入力/出力から何を一般化できますか?

機械学習システムは、データまたはモデルのアーキテクチャから取得された情報により、適切に一般化されます。近年、一般化のレベルが高まってきています。そのため、論文を読むときは、驚くべき一般化機能とその出所(データ、バイアス、またはその両方)を探すようにしています。

因果推論、記号的アプローチ、オブジェクト中心の表現など、ノイズが多い領域では、より優れた帰納的バイアスが存在します。これらは堅牢で信頼性の高い機械学習システムを構築するための重要なツールであり、構造化データとモデルのバイアスとの境界が曖昧になる場合があることは承知しています。そうは言っても、機械学習を前進させるには学習の量を減らし、ハードコードされた動作の量を増やすことだ、と多くの研究者が信じているのはなぜなのか、私には理解できません。

私たちが「機械学習」の研究をする理由は、まさにハードコードする方法が分からないものがあるからです。機械学習の研究者として、私たちは学習方法の改善に力を注ぎ、ハードコーディングやシンボリックな方法は機械学習の研究者に任せるべきです。

5. 結論は反証可能か?

反証不可能であると主張する論文は科学の領域には属さない。

オリジナルリンク: https://blog.evjang.com/2021/01/understanding-ml.html

[この記事は51CTOコラムBig Data Digest、WeChatパブリックアカウント「Big Data Digest(id: BigDataDigest)」のオリジナル翻訳です]

この著者の他の記事を読むにはここをクリックしてください

<<:  2021 年のトップ 12 AI ツールとフレームワーク

>>:  ロボティックプロセスオートメーションの開発展望

ブログ    
ブログ    

推薦する

北京大学の具現化知能チームは、人間のニーズに合わせてロボットをより効率的にするための需要主導型ナビゲーションを提案した。

ロボットに手伝ってもらいたい場合は、通常、より正確な指示を与える必要がありますが、指示の実際の実装は...

ソフトバンクの孫正義社長:AIの知能は10年以内に人間を超えると予想

ロイター通信は10月4日、ソフトバンクグループの創業者兼CEOの孫正義氏が本日、汎用人工知能(AGI...

原理、コード、デモを備えたこのアルゴリズム リソースは人気を博しています。 GitHub で 2900 以上のスターを獲得

最近、GitHub で非常に包括的なアルゴリズム リソースが人気を集めています。対応する原理の紹介と...

人材管理を改善する人工知能の可能性

AI は人間の従業員の努力を補完し、彼らの時間を解放することができます。人事担当者はこの機会を利用し...

ロボットは人工知能技術に基づいて人間の表情を作る

信頼関係を築く上で、私たちの表情が果たす役割は非常に大きいにもかかわらず、ほとんどのロボットの顔はプ...

Jupyter のアップグレード: さまざまな大規模モデルを接続し、コードを生成し、チャットを通じてエラーを修正できます

これで、大規模言語モデル (LLM) が Jupyter に接続されました。これは主に、Projec...

世界トップ10のAIトレーニングチップの包括的なレビュー

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

秘密裏に利用規約を変更したことで、Software Freedom Conservancy が激怒しました。オープンソースコミュニティがZoomの放棄を呼び掛け

パンデミックの間、リモートワークは必須となり、多くのビデオ会議ツールが普及しました。 Zoom は最...

RAG 上級スキル - ウィンドウ コンテキスト取得の実装方法

この記事では、RAG (Retrieval-Augmented Generation) モデルの検索...

...

AWSクラウド上で機械学習を輸出するための黄金のツールであるAmazon SageMakerが正式に中国に上陸

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...

...

C#とTypeScriptの作者がオープンソースAIプロジェクトTypeChatを発表

7月24日、C#とTypeScriptの父であるAnders Hejlsberg氏が、ユーザーがAI...

太陽光パネルを日中に検査するためのドローンベースのSWIRカメラ

短波赤外線ベースのエレクトロルミネッセンスイメージングは​​、太陽光発電パネルの欠陥検出に有望です。...

ディープニューラルネットワークをデバッグするにはどのような方法を使用しますか? 4つの簡単な方法をご紹介します

データセットの構築、ニューラル ネットワークのコーディング、モデルのトレーニングに何週間も費やした後...