偉大な人物が学界に復帰:何開明氏がMITへの入学を発表

偉大な人物が学界に復帰:何開明氏がMITへの入学を発表

「FAIR研究科学者として、私は2024年にMITのEECS教授陣に加わります。」

AI分野の著名な学者であり、ResNetの発明者でもある何開明氏は最近、自身の個人ウェブサイトで、近々学界に復帰すると発表した。

カイミンはプロフィール写真も新しいものに変更した。

近年のテクノロジー企業が大型モデルを競い合い、AIGCが新たな成長ポイントとなる中、何開明氏は研究に専念することを選択し、先駆的な選択をしました。

人々はこれを歓迎し、「彼の生徒たちは本当に幸運だ」と言った。

今後、何開明氏のシンプルで率直な研究スタイルを学ぶ若い世代が出てくるのだろうか。

また、MITのような名門大学でさえ、産業界の研究所ほど豊富なGPUコンピューティングリソースを持っていないため、MITに入学した後もMeta氏と密接な関係を維持できるのではないかと期待する人もいた。

人々は称賛を表明するだけでなく、何開明氏の将来の科学研究の方向性を予測し始めた。彼の個人ウェブサイトの説明によると、「コンピュータービジョンの問題というレンズを通して、さまざまな分野に適用できる一般的な方法を開発することが私の目標です。私の現在の研究は、複雑な世界の表現を学習できるコンピューターモデルの構築と、複雑な世界に対する知能の探求に焦点を当てています。私の研究の長期的な目標は、より強力な人工知能を通じて人間の知能を高めることです。」

これは現実世界と対話する AI、ロボットを意味するのでしょうか?

注目の移籍

何開明氏の行方は4か月前にAI分野で話題になった。

今年3月、MITのウェブサイトで特別講義のプレビューを多くの人が発見しました。

 

MITのEECSでは、このような「特別セミナー」は通常、職に応募しに来た学者による「面接」であり、その内容は主に求職者の研究成果を披露することである。予想外に、学術界のスターである何開明氏のための小さなイベントが、大規模なスターを追いかけるイベントに発展しました。イベント当日、会議室が満員になったため、MITは臨時に映写室を開放しなければなりませんでした。その結果、遠隔視聴用の部屋も満員でした。

画像はZhihuより

これは人々がこの偉大な神を認識していることを示しています。

イベントに参加した学生によると、今回の講演で何凱明氏は主にResNet、Faster R-CNN、Mask R-CNN、MoCo、MAEなど自身の過去の研究を紹介したという。また、さまざまな科学分野の研究を支援する汎用ツールとしての AI や、自己教師あり学習のより広範な応用など、将来に向けたビジョンもある程度あります。

何開明氏はMIT訪問後、最近ニューヨーク大学とプリンストン大学で講演を行った。

大学入試トップスコアラーからトップAI科学者へ

何開明氏は、私たち全員がよく知っている AI 科学者の一人であり、コンピューター ビジョンの分野では彼の名前を知らない人はいないでしょう。

2003年、何開明さんは広東省大学入学試験で標準得点900点で総合点1位を獲得し、清華大学物理学部基礎科学クラスに入学した。清華大学物理学部基礎科学クラスを卒業後、香港中文大学マルチメディア研究所に入学し、唐暁氏の指導の下で博士号取得を目指した。 He Kaiming 氏は 2007 年に Microsoft Research Asia のビジュアル コンピューティング グループでインターンシップを行い、Sun Jian 博士を指導者として指導しました。

2011 年に博士号を取得した後、He Kaiming は Microsoft Research Asia に研究者として入社しました。 2016年、Kaiming He は Facebook 人工知能ラボに入社し、それ以来ずっと研究科学者として活動しています。

何開明氏の研究は数々の賞を受賞した。 2009年、唐暁教授、孫建博士、当時博士課程の学生だった何開明が共同で完成させた論文「ダークプライマリに基づく単一画像ヘイズ除去技術」が、世界最高峰のコンピュータビジョンカンファレンスCVPRで最優秀論文賞を受賞しました。また、同カンファレンス設立以来25年間でアジアの学者が最高賞を受賞したのは初めてのことでした。

唐暁欧と何開明

2016年、He Kaiming 氏は ResNet で再び CVPR 最優秀論文賞を受賞しました。さらに、彼の論文の 1 つは CVPR2021 最優秀論文賞にノミネートされました。何凱明さんはMask R-CNNでICCV 2017の最優秀論文賞(Marr賞)も受賞し、その年の優秀学生論文の研究にも参加しました。

Google Scholarの統計によると、He Kaimingは合計73本の論文を発表しており、H指数は67です。 2023年7月現在、何開明氏の研究は46万回以上引用されており、年間10万回以上のペースで増加しています。

これはどの程度の大きさですか?つまり、MIT に入学すると、彼は専攻分野に関係なく、直ちに学内で最も多くの引用数を誇る学者になるのです。

開明は当時「傑作」を出版した。

開明師匠の作品といえば、ResNetが最も有名です。この論文は7年前に発表され、現在までに17万回以上引用されています。

「画像認識のためのディープ残差学習」は、2016 年にトップ コンピューター ビジョン カンファレンス CVPR で最優秀論文賞を受賞しました。論文の著者4人、何開明、張向宇、任紹青、孫建は、現在では人工知能の分野でよく知られた人物だ。当時、彼らは全員、マイクロソフトリサーチアジアのメンバーだった。

もう一人の偉大な学者である Li Mu は、畳み込みニューラル ネットワークを使用している場合、ResNet またはそのバリエーションを使用している可能性は 50% あると述べました。

He Kaiming の残差ネットワーク (ResNet) に関する論文は、深層ネットワークの勾配転送問題を解決しました。この論文は、2019 年、2020 年、2021 年の Google Scholar Metrics ですべての研究分野にわたって最も引用された論文であり、最新のディープラーニング モデル (Transformers、AlphaGo Zero、AlphaFold など) の基本的な構成要素を確立しました。

今日の大規模モデルで使用されているトランスフォーマー エンコーダーとデコーダーにはすべて、ResNet から派生した残差リンクがあります。

「ResNet以降、100層以上のディープニューラルネットワークを効果的にトレーニングできるようになり、ネットワークを非常に深くすることができる」と唐暁氏は2023年世界人工知能大会でのスピーチで何開明氏の学術的貢献を称賛した。「何開明氏はニューラルネットワークをより深くし、Googleはニューラルネットワークの入り口を広げ、より深く、より大きくして、今日の大規模モデルとなった」

2021年11月、何開明氏は筆頭著者として「マスクオートエンコーダはスケーラブルな視覚学習者」と題する論文を発表し、優れた汎化性能を持つコンピュータービジョン認識モデルを提案しました。発表されるや否や、コンピュータービジョン界でも話題となりました。

AI分野の新参者として、私は探索プロセスにおける多くの重要な研究論文の主著者が何開明氏であることにしばしば驚かされます。何開明氏は長年この業界に携わっていますが、科学研究に対する彼の姿勢は常に基準とみなされてきました。彼が筆頭著者として発表する論文は毎年わずか数本ですが、それらはほぼ例外なく間違いなく重量級のものです。

また、私たちは何開明氏の仕事のスタイルに感心することがよくあります。画期的な論文でさえ、簡潔で読みやすいことが多いのです。彼は、トリックや不必要な証明を使わず、美しい直感だけを使って、最も直感的な方法で「シンプルな」アイデアを説明します。

学界に戻った今、Kaiming がさらに素晴らしい作品を発表してくれることを期待しています。

<<:  30% のトークンで SOTA パフォーマンスを達成、Huawei Noah 軽量ターゲット検出器 Focus-DETR が効率を 2 倍に

>>:  LLM評価レビュー論文が出版され、3つの側面から包括的にまとめられ、データベースも掲載されている

ブログ    
ブログ    

推薦する

モデル融合、ハイブリッド専門家、小規模LLM、2024年のLLMの発展方向を理解するためのいくつかの論文

過去2023年間で、大規模言語モデル(LLM)は潜在力と複雑さの両面で急速に成長しました。 2024...

基数ソートのヒント 1 つ、ソート方法 2 つ、ソートアルゴリズム 3 つ

[[421174]]基数ソートコンセプト基数ソートは、整数をビットごとにソートする非比較整数ソート ...

AIを使って株取引で不正行為をしよう!この世代のプログラマーは本当に楽しみ方を知っている

ディープラーニングを使用して株価を予測することは、以前は少し神秘的に思えたかもしれませんが、新しいこ...

わかりやすく解説: 機械学習と統計モデリングの違い

これらは互いに大きく異なっており、すべてのデータ サイエンティストはその理由と方法を理解する必要があ...

...

ビデオPSツール!文字の非表示と透かしの除去:CVPRで発表されたこの研究はオープンソース化されました

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

人工知能対神: インダストリー4.0におけるグローバル社会の微妙なつながり

[[423479]]はい、タイトルの読み方は正しいです。特にインダストリー 4.0 では、AI と神...

米国労働統計局は機械学習を使用してデータコーディングを自動化しています

政府機関には常にさまざまな文書が詰まっていますが、その多くは紙の文書であり、電子文書であっても、実際...

「顔を見る」時代において、顔認識は「マーケティング」の共犯者にはなり得ない

315ガラはカメラの顔認識の悪用の問題を暴露し、懸念を引き起こした。これはまた、問題を浮き彫りにする...

私たちは本当にロボットの「カンブリア紀の進化」に近づいているのでしょうか?

ロボット工学の分野は驚異的なスピードで進歩しており、多くの専門家がこの急速な発展を生物学における「カ...

人工知能とソフトウェアアーキテクチャ

[[192443]] AlphaGoの登場により、2016年は人工知能元年とも言えるでしょう。蘇州で...

北京大学やテンセントなどが言語を使ってマルチモーダル情報を整合させるLanguageBindを提案し、複数のランキングを更新した。

現代社会では、情報の伝達やコミュニケーションはもはや単一のモードに限定されなくなりました。私たちは、...

...

トレンドにおける危険とチャンス: 生成 AI の黄金期をどう捉えるか?

ChatGPTは今年9月末に音声チャットと画像認識機能を追加しました。テキスト駆動型と比較して、C...