天津大学の学部生の論文がCVPR 2022に選出され、ディープラーニングのロングテール分類で新たなSOTAを達成

天津大学の学部生の論文がCVPR 2022に選出され、ディープラーニングのロングテール分類で新たなSOTAを達成

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載しています。転載の際は出典元にご連絡ください。

学部生は科学研究でどのような成果を上げることができますか?

CVPR 2022 に最近収録された新しい論文では、ディープラーニングにおけるロングテール分布データの分類問題を解決するための新しいアプローチが提供され、最終的に新しい SOTA が達成されています。

著者は合計 5 名で、シンガポールの A*STAR の博士課程の学生と上級研究員が含まれています。

著者天津大学学部生である李氏です

驚くべきことに、これはこの「若き才能」にとって初めてのトップカンファレンス論文ではありません。彼はこれ以前にも、データマイニング分野のトップカンファレンス(WWW 2022)で第一著者として優勝しています。

学部生が科学研究に取り組む勢いはすでにそれほど強いのでしょうか?

私は3年生の時に研究室に入り、4年生の時にトップ論文を2本発表しました。

李さんは天津大学の知能・コンピューティング学部出身で今年の4年生です

この CVPR の記事では、主に新しいアンサンブル学習戦略を使用して、ロングテール分類の問題を解決します。

ご存知のとおり、ロングテール分布とこのデータの分類は、ディープラーニングでは非常に一般的なアプリケーションです。

主な難しさは、サンプル サイズの極端な不均衡特にテール サンプルの数が少ないことにあります。これにより、効果的なトレーニング結果を得ることが困難になります。

現在、アンサンブル学習ベースの方法は大きな可能性を示しており、SOTA パフォーマンスを達成しています。

しかし、このアプローチには 2 つの制限があります。

まず、障害の影響を受けやすいアプリケーションでの予測は通常は信頼性が低く、エラーが発生しやすいテール データに大きな影響を与えます。

第二に、すべてのサンプルに均一な量のリソース(エキスパート)を割り当てるため、単純なサンプルに対して冗長かつ過度に高い計算コストが発生します。

そのため、Liらは不確実性統合を導入することでテールカテゴリサンプルの自動認識を実現することを提案した。

これを基にパフォーマンスと効率のバランスをとるために、ヘッド サンプルよりもテール カテゴリ サンプルに多くのモデル リソース(エキスパート)を動的に割り当てることが提案されています。

△ テスト段階では、ハーバード大学が提案したDS理論を使用して、共同不確実性を形成する。

最終的に、得られたモデルは、テールカテゴリサンプルの自動検出とトレーニング調整を実現し、ロングテール分類問題を解決するための一般的なモデルになります。

分類、テール検出、外れ値検出、障害予測などの一連のタスクに関する包括的な実験により、提案されたモデルのパフォーマンスが既存の SOTA 方法を上回ることが実証されています

3年生の時、李さんは優秀な学業成績を評価され、学部の機械学習とデータマイニングの研究室に入学しました

私の指導教官である張長青氏(天津大学の博士課程の指導者)の指導の下、わずか1年半の研究で、私は2つのトップカンファレンス論文の受賞を果たしました

若者は恐ろしいと言える。

ますます多くの学部生が論文を発表し始めている

しかし、学部生の研究に関しては、誰もが注意を払う必要があります。多くの学校は、この点についてよりオープンになり、より関心を持つようになっています。

3年目以下では、研究室に入り、大学院生や博士課程の学生と一緒に科学研究を行うための枠がいくつか開かれます。

例えば、清華大学の「スパーククラス」は2年生を募集しており、北京大学も学生が2年生の早い段階から科学研究プロジェクトを開始することを奨励しており、中国科学技術大学などの学校も、対応する業績を上げた学部生に特別奨学金を提供しています

こうした状況下、李さんのように学部在学中にトップレベルの会議で論文を発表し、栄光に包まれている学生はすでに多くいる。

例えば、清華大学特別賞受賞者であり、2016年度の学部生として有名な高天宇氏は、大学在学中の4年間で4つのトップカンファレンス(AAAI 2回、EMNLP 2回)で論文を発表しています。また、ライブ放送を主催して、科学研究の経験を共有しました。

たとえば、 MITの学部生であるMao Xiaoさんは、大学4年生の時にトップのコンピュータ理論カンファレンスFOCS 2021への出場権を獲得し、最優秀学生論文賞を受賞しました。

もう一つの例としては、清華大学電子工学部の学部生であるLiu Hongは、トップカンファレンスで第一著者として3本の論文を発表しています。北京大学の学部生であるWu Kewenは、トップカンファレンス(ACM Annual Conference on Theory of Computing STOC)で論文を発表しただけでなく、最優秀論文賞も受賞しています。中国電子科学技術大学の学部生であるWang Tanも、CVPR 2020で第一著者として論文を発表しています。浙江大学の学部生であるRen Yiも、ICML 2019で第一著者として論文を発表しています...

同様の例はたくさんあります。

学部生の科学研究能力はますます高まっていると言えます。どう思われますか?​

<<:  人工知能音声ジェネレーター、この10個で十分です

>>:  模型の列車の速度を上げるコツは何でしょうか?まず、この問題の第一原理を理解しましょう。

ブログ    
ブログ    
ブログ    
ブログ    
ブログ    

推薦する

流行を予防し制御するために、人工知能はまだ3つの大きな問題を解決する必要がある

新型コロナウイルス感染症は、中華人民共和国成立以来、最も急速に広がり、最も広範囲に及び、最も困難な公...

AIデータのラベル付けは大量にアウトソーシングされており、南アフリカ、ベネズエラなどの国の人々はデジタル搾取の運命から逃れられない

歴史的に、これらの国や地域は旧植民地帝国によって貧困化しており、ヨーロッパの植民地主義は土地の暴力的...

沈興陽博士:30年間の科学研究で私が遭遇した落とし穴

先日開催されたX-Talkでは、米国工学アカデミーの外国人会員であり、XiaoIce会長でもあるハリ...

AIの「ショートカット」がシミュレーションを数十億倍高速化

[[314916]]シミュレーターは、NASA がエアロゾル モデルを使用してオーストラリアの火災に...

2023年に最も注目すべきソフトウェアテスト業界のトレンドと動向の分析

2023年はソフトウェアテスト業界にとって変化とチャンスに満ちた年です。ソフトウェア業界の急速な発展...

プログラマーが使用する基本アルゴリズムトップ10

[[188736]]アルゴリズム1: クイックソートアルゴリズムクイックソートは、Tony Hal...

MITとマイクロソフトはAI向けにLeetCodeプログラミング問題集をカスタマイズした

[[407672]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...

7.4K スター! わずか数分で機械学習モデル用の美しいインタラクティブ インターフェースを生成できます

Gradio は、機械学習やデータ サイエンス関連のデモや Web アプリケーションを構築するための...

AIを活用してよりスマートな電子データ交換を実現

電子データ交換 (EDI) の歴史は、企業がより効率的に電子的にデータを交換する方法を模索し始めた ...

崑崙万為が「天宮」13Bシリーズ大型モデルをオープンソース化、商用利用のハードルはゼロ

10月30日、崑崙万為は、数百億語の容量を持つ大規模言語モデル「天工」Skywork-13Bシリーズ...

中国科学院研究員蔡少偉:SATソルバーEDA基本エンジン

[[441194]]この記事はLeiphone.comから転載したものです。転載する場合は、Leip...

会話型 AI でビジネス成果を向上させる 5 つの方法

[[379724]]良好なコミュニケーションはビジネスを推進し、組織に戦略的に実装された人工知能 (...

「林季」が中国国際サービス貿易交易会に登場しました! Orange Cloud AIエコシステムが従来の産業の束縛を打ち破る

9月3日午後、「オレンジクラウドテクノロジーイノベーションプラットフォームが産業企業のデジタル変革を...

機械学習の実践者が直面する8つの大きな課題

機械学習 (ML) や人工知能 (AI) と聞くと、多くの人はロボットやターミネーターを想像します。...

...