偉大な人物が学界に復帰:何開明氏がMITへの入学を発表

偉大な人物が学界に復帰:何開明氏がMITへの入学を発表

「FAIR研究科学者として、私は2024年にMITのEECS教授陣に加わります。」

AI分野の著名な学者であり、ResNetの発明者でもある何開明氏は最近、自身の個人ウェブサイトで、近々学界に復帰すると発表した。

カイミンはプロフィール写真も新しいものに変更した。

近年のテクノロジー企業が大型モデルを競い合い、AIGCが新たな成長ポイントとなる中、何開明氏は研究に専念することを選択し、先駆的な選択をしました。

人々はこれを歓迎し、「彼の生徒たちは本当に幸運だ」と言った。

今後、何開明氏のシンプルで率直な研究スタイルを学ぶ若い世代が出てくるのだろうか。

また、MITのような名門大学でさえ、産業界の研究所ほど豊富なGPUコンピューティングリソースを持っていないため、MITに入学した後もMeta氏と密接な関係を維持できるのではないかと期待する人もいた。

人々は称賛を表明するだけでなく、何開明氏の将来の科学研究の方向性を予測し始めた。彼の個人ウェブサイトの説明によると、「コンピュータービジョンの問題というレンズを通して、さまざまな分野に適用できる一般的な方法を開発することが私の目標です。私の現在の研究は、複雑な世界の表現を学習できるコンピューターモデルの構築と、複雑な世界に対する知能の探求に焦点を当てています。私の研究の長期的な目標は、より強力な人工知能を通じて人間の知能を高めることです。」

これは現実世界と対話する AI、ロボットを意味するのでしょうか?

注目の移籍

何開明氏の行方は4か月前にAI分野で話題になった。

今年3月、MITのウェブサイトで特別講義のプレビューを多くの人が発見しました。

 

MITのEECSでは、このような「特別セミナー」は通常、職に応募しに来た学者による「面接」であり、その内容は主に求職者の研究成果を披露することである。予想外に、学術界のスターである何開明氏のための小さなイベントが、大規模なスターを追いかけるイベントに発展しました。イベント当日、会議室が満員になったため、MITは臨時に映写室を開放しなければなりませんでした。その結果、遠隔視聴用の部屋も満員でした。

画像はZhihuより

これは人々がこの偉大な神を認識していることを示しています。

イベントに参加した学生によると、今回の講演で何凱明氏は主にResNet、Faster R-CNN、Mask R-CNN、MoCo、MAEなど自身の過去の研究を紹介したという。また、さまざまな科学分野の研究を支援する汎用ツールとしての AI や、自己教師あり学習のより広範な応用など、将来に向けたビジョンもある程度あります。

何開明氏はMIT訪問後、最近ニューヨーク大学とプリンストン大学で講演を行った。

大学入試トップスコアラーからトップAI科学者へ

何開明氏は、私たち全員がよく知っている AI 科学者の一人であり、コンピューター ビジョンの分野では彼の名前を知らない人はいないでしょう。

2003年、何開明さんは広東省大学入学試験で標準得点900点で総合点1位を獲得し、清華大学物理学部基礎科学クラスに入学した。清華大学物理学部基礎科学クラスを卒業後、香港中文大学マルチメディア研究所に入学し、唐暁氏の指導の下で博士号取得を目指した。 He Kaiming 氏は 2007 年に Microsoft Research Asia のビジュアル コンピューティング グループでインターンシップを行い、Sun Jian 博士を指導者として指導しました。

2011 年に博士号を取得した後、He Kaiming は Microsoft Research Asia に研究者として入社しました。 2016年、Kaiming He は Facebook 人工知能ラボに入社し、それ以来ずっと研究科学者として活動しています。

何開明氏の研究は数々の賞を受賞した。 2009年、唐暁教授、孫建博士、当時博士課程の学生だった何開明が共同で完成させた論文「ダークプライマリに基づく単一画像ヘイズ除去技術」が、世界最高峰のコンピュータビジョンカンファレンスCVPRで最優秀論文賞を受賞しました。また、同カンファレンス設立以来25年間でアジアの学者が最高賞を受賞したのは初めてのことでした。

唐暁欧と何開明

2016年、He Kaiming 氏は ResNet で再び CVPR 最優秀論文賞を受賞しました。さらに、彼の論文の 1 つは CVPR2021 最優秀論文賞にノミネートされました。何凱明さんはMask R-CNNでICCV 2017の最優秀論文賞(Marr賞)も受賞し、その年の優秀学生論文の研究にも参加しました。

Google Scholarの統計によると、He Kaimingは合計73本の論文を発表しており、H指数は67です。 2023年7月現在、何開明氏の研究は46万回以上引用されており、年間10万回以上のペースで増加しています。

これはどの程度の大きさですか?つまり、MIT に入学すると、彼は専攻分野に関係なく、直ちに学内で最も多くの引用数を誇る学者になるのです。

開明は当時「傑作」を出版した。

開明師匠の作品といえば、ResNetが最も有名です。この論文は7年前に発表され、現在までに17万回以上引用されています。

「画像認識のためのディープ残差学習」は、2016 年にトップ コンピューター ビジョン カンファレンス CVPR で最優秀論文賞を受賞しました。論文の著者4人、何開明、張向宇、任紹青、孫建は、現在では人工知能の分野でよく知られた人物だ。当時、彼らは全員、マイクロソフトリサーチアジアのメンバーだった。

もう一人の偉大な学者である Li Mu は、畳み込みニューラル ネットワークを使用している場合、ResNet またはそのバリエーションを使用している可能性は 50% あると述べました。

He Kaiming の残差ネットワーク (ResNet) に関する論文は、深層ネットワークの勾配転送問題を解決しました。この論文は、2019 年、2020 年、2021 年の Google Scholar Metrics ですべての研究分野にわたって最も引用された論文であり、最新のディープラーニング モデル (Transformers、AlphaGo Zero、AlphaFold など) の基本的な構成要素を確立しました。

今日の大規模モデルで使用されているトランスフォーマー エンコーダーとデコーダーにはすべて、ResNet から派生した残差リンクがあります。

「ResNet以降、100層以上のディープニューラルネットワークを効果的にトレーニングできるようになり、ネットワークを非常に深くすることができる」と唐暁氏は2023年世界人工知能大会でのスピーチで何開明氏の学術的貢献を称賛した。「何開明氏はニューラルネットワークをより深くし、Googleはニューラルネットワークの入り口を広げ、より深く、より大きくして、今日の大規模モデルとなった」

2021年11月、何開明氏は筆頭著者として「マスクオートエンコーダはスケーラブルな視覚学習者」と題する論文を発表し、優れた汎化性能を持つコンピュータービジョン認識モデルを提案しました。発表されるや否や、コンピュータービジョン界でも話題となりました。

AI分野の新参者として、私は探索プロセスにおける多くの重要な研究論文の主著者が何開明氏であることにしばしば驚かされます。何開明氏は長年この業界に携わっていますが、科学研究に対する彼の姿勢は常に基準とみなされてきました。彼が筆頭著者として発表する論文は毎年わずか数本ですが、それらはほぼ例外なく間違いなく重量級のものです。

また、私たちは何開明氏の仕事のスタイルに感心することがよくあります。画期的な論文でさえ、簡潔で読みやすいことが多いのです。彼は、トリックや不必要な証明を使わず、美しい直感だけを使って、最も直感的な方法で「シンプルな」アイデアを説明します。

学界に戻った今、Kaiming がさらに素晴らしい作品を発表してくれることを期待しています。

<<:  30% のトークンで SOTA パフォーマンスを達成、Huawei Noah 軽量ターゲット検出器 Focus-DETR が効率を 2 倍に

>>:  LLM評価レビュー論文が出版され、3つの側面から包括的にまとめられ、データベースも掲載されている

ブログ    
ブログ    

推薦する

AIブームの中で、取締役会とCEOはAIを包括的に理解する必要がある

AIが私たちの日常生活の一部になっていることは否定できません。ほぼすべての業界のフォーチュン 100...

AIが労働力に与える影響について考えられる3つのシナリオ

「生成AIは、農業革命と産業革命以来、労働力に最も大きな変化をもたらす可能性があります。」まあ、あま...

5G自動運転車が景勝地でデビュー、商用利用のシナリオも間もなく登場

[[264714​​]]最近、5G携帯電話や5G商用利用に関するニュースが多く出ています。国内外の多...

この記事では、人工知能がクラウドコンピューティングをどのように変え、私たちの生活にどのような影響を与えるかを説明します。

AIがクラウドコンピューティングをどう変えるかクラウド コンピューティングは、オンライン アクティ...

ドローン盗撮の防止は難しく、3つの面での取り組みが必須

近年、民間ドローンの急速な普及は、空中撮影、レジャーや娯楽、農作物の保護、電力検査など、人々の生産と...

テキストマイニングの詳細: ツール、タスク、問題、解決策

[51CTO.com クイック翻訳] 現在、世界中のあらゆる場所で大量のデータが絶えず生成されており...

人工知能と自然言語処理の概要: AI の 3 つの主要段階と NLP の主な応用分野

最近、Xenonstack は Jagreet Kaur 氏による「人工知能の概要とビッグデータにお...

世界で最も賢い人たちは AI についてどう考えているのでしょうか?彼らは13の主要な発展傾向を予測している

[[219763]]著者:ROSIEBROWN編纂者:彭祥偉、江宝尚、小玉ウォール・ストリート・ジャ...

...

分散型コンセンサスアルゴリズム: 想像以上に複雑

1. 分散システムの難しさ張大鵬は難しい問題に遭遇した。彼らの会社には貴重なデータを保存しているサー...

GPT-4、ChatGLM2、Llama2、PaLM2がKDD LLM Dayで共同会議を開催しました

今週、データマイニングのトップカンファレンスであるACM KDD 2023が米国ロングビーチで開幕し...

...

...

WatsonAIOps - AIの力を活用して、IT運用の効率とセキュリティの持続可能性を次のレベルに引き上げます

情報技術 (IT) 運用管理は、ミッションクリティカルなビジネス アプリケーションをサポートするため...

GoogleはAIチップに出産を学習させ、次世代のTPUはAI自身によって設計される

[[405016]]この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI...