天津大学の学部生の論文がCVPR 2022に選出され、ディープラーニングのロングテール分類で新たなSOTAを達成

天津大学の学部生の論文がCVPR 2022に選出され、ディープラーニングのロングテール分類で新たなSOTAを達成

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

学部生は科学研究でどのような成果を上げることができますか?

CVPR 2022 に最近収録された新しい論文では、ディープラーニングにおけるロングテール分布データの分類問題を解決するための新しいアプローチが提供され、最終的に新しい SOTA が達成されています。

著者は合計 5 名で、シンガポールの A*STAR の博士課程の学生と上級研究員が含まれています。

著者天津大学学部生である李氏です

驚くべきことに、これはこの「若き才能」にとって初めてのトップカンファレンス論文ではありません。彼はこれ以前にも、データマイニング分野のトップカンファレンス(WWW 2022)で第一著者として優勝しています。

学部生が科学研究に取り組む勢いはすでにそれほど強いのでしょうか?

私は3年生の時に研究室に入り、4年生の時にトップ論文を2本発表しました。

李さんは天津大学の知能・コンピューティング学部出身で今年の4年生です

この CVPR の記事では、主に新しいアンサンブル学習戦略を使用して、ロングテール分類の問題を解決します。

ご存知のとおり、ロングテール分布とこのデータの分類は、ディープラーニングでは非常に一般的なアプリケーションです。

主な難しさは、サンプル サイズの極端な不均衡特にテール サンプルの数が少ないことにあります。これにより、効果的なトレーニング結果を得ることが困難になります。

現在、アンサンブル学習ベースの方法は大きな可能性を示しており、SOTA パフォーマンスを達成しています。

しかし、このアプローチには 2 つの制限があります。

まず、障害の影響を受けやすいアプリケーションでの予測は通常は信頼性が低く、エラーが発生しやすいテール データに大きな影響を与えます。

第二に、すべてのサンプルに均一な量のリソース(エキスパート)を割り当てるため、単純なサンプルに対して冗長かつ過度に高い計算コストが発生します。

そのため、Liらは不確実性統合を導入することでテールカテゴリサンプルの自動認識を実現することを提案した。

これを基にパフォーマンスと効率のバランスをとるために、ヘッド サンプルよりもテール カテゴリ サンプルに多くのモデル リソース(エキスパート)を動的に割り当てることが提案されています。

△ テスト段階では、ハーバード大学が提案したDS理論を使用して、共同不確実性を形成する。

最終的に、得られたモデルは、テールカテゴリサンプルの自動検出とトレーニング調整を実現し、ロングテール分類問題を解決するための一般的なモデルになります。

分類、テール検出、外れ値検出、障害予測などの一連のタスクに関する包括的な実験により、提案されたモデルのパフォーマンスが既存の SOTA 方法を上回ることが実証されています

3年生の時、李さんは優秀な学業成績を評価され、学部の機械学習とデータマイニングの研究室に入学しました

私の指導教官である張長青氏(天津大学の博士課程の指導者)の指導の下、わずか1年半の研究で、私は2つのトップカンファレンス論文の受賞を果たしました

若者は恐ろしいと言える。

ますます多くの学部生が論文を発表し始めている

しかし、学部生の研究に関しては、誰もが注意を払う必要があります。多くの学校は、この点についてよりオープンになり、より関心を持つようになっています。

3年目以下では、研究室に入り、大学院生や博士課程の学生と一緒に科学研究を行うための枠がいくつか開かれます。

例えば、清華大学の「スパーククラス」は2年生を募集しており、北京大学も学生が2年生の早い段階から科学研究プロジェクトを開始することを奨励しており、中国科学技術大学などの学校も、対応する業績を上げた学部生に特別奨学金を提供しています

こうした状況下、李さんのように学部在学中にトップレベルの会議で論文を発表し、栄光に包まれている学生はすでに多くいる。

例えば、清華大学特別賞受賞者であり、2016年度の学部生として有名な高天宇氏は、大学在学中の4年間で4つのトップカンファレンス(AAAI 2回、EMNLP 2回)で論文を発表しています。また、ライブ放送を主催して、科学研究の経験を共有しました。

たとえば、 MITの学部生であるMao Xiaoさんは、大学4年生の時にトップのコンピュータ理論カンファレンスFOCS 2021への出場権を獲得し、最優秀学生論文賞を受賞しました。

もう一つの例としては、清華大学電子工学部の学部生であるLiu Hongは、トップカンファレンスで第一著者として3本の論文を発表しています。北京大学の学部生であるWu Kewenは、トップカンファレンス(ACM Annual Conference on Theory of Computing STOC)で論文を発表しただけでなく、最優秀論文賞も受賞しています。中国電子科学技術大学の学部生であるWang Tanも、CVPR 2020で第一著者として論文を発表しています。浙江大学の学部生であるRen Yiも、ICML 2019で第一著者として論文を発表しています...

同様の例はたくさんあります。

学部生の科学研究能力はますます高まっていると言えます。どう思われますか?​

<<:  人工知能音声ジェネレーター、この10個で十分です

>>:  模型の列車の速度を上げるコツは何でしょうか?まず、この問題の第一原理を理解しましょう。

ブログ    

推薦する

ディープラーニングデータセットを管理するための新しいアプローチ

ハブの紹介 Activeloop の Hub は、Numpy のような配列にデータを配置するオープン...

...

2019年北京知源会議が北京で開幕、中国と海外の学術リーダーが人工知能研究の最前線について議論

10月31日、北京知源人工知能研究所が主催する2019年北京知源大会が国家会議センターで2日間にわた...

ビッグニュース!アリババの音声認識モデルのコア技術により、未来を「聞く」ことができる

[[255840]] Ali Sister の紹介: 音声認識技術は人工知能技術の重要な部分として、...

ビッグデータの機械理解の秘密:クラスタリングアルゴリズムの詳細な説明

この記事では、いくつかのクラスタリング アルゴリズムの基本的な概要を示し、シンプルでありながら詳細な...

新しい小売業界における人工知能の応用

インターネットの急速な発展に伴い、伝統的なオフライン小売チャネルは弱体化の兆候を見せ始めており、中国...

李開復、胡宇、張亜琴の GMIC 2018 対談: AI 戦略と AI 人材育成における中国と米国の違いは何ですか?

[[227402]]人工知能が急成長を遂げている現在、AI人材の不足は中国だけでなく、世界全体が直...

将来、音声認識はどのような商業シナリオに適用される可能性がありますか?

Companies and Markets の評価レポートでは、世界の音声認識市場は今後さらに多様...

自動運転車が将来の都市生活に及ぼす影響

倫理的配慮無人運転車の問題は、自動運転車の倫理性の問題として要約できます。この問題の典型的なバージョ...

...

ソフトウェアがハードウェアを飲み込むAI時代において、チップがアルゴリズムの進化に追いつけない場合、私たちはどうすればよいのでしょうか?

AI時代の陰の立役者として、チップ業界は徐々にかつ継続的な変化を遂げています。 2008 年以降、...

機械学習: TensorFlow 2.0 の 10 のヒント

この記事では、TensorFlow 2.0 の 10 の機能について説明します。 [[326673]...

Google の FLoC アルゴリズムは、プライバシー保護の向上か、広告テクノロジーの向上か?

Android システムでは、Nut Hidden APP をダウンロードして、セキュリティリスク...

チップ設計の極めて高いハードルがAIによって「打ち破られる」

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式...