「FAIR研究科学者として、私は2024年にMITのEECS教授陣に加わります。」 AI分野の著名な学者であり、ResNetの発明者でもある何開明氏は最近、自身の個人ウェブサイトで、近々学界に復帰すると発表した。 カイミンはプロフィール写真も新しいものに変更した。 近年のテクノロジー企業が大型モデルを競い合い、AIGCが新たな成長ポイントとなる中、何開明氏は研究に専念することを選択し、先駆的な選択をしました。 人々はこれを歓迎し、「彼の生徒たちは本当に幸運だ」と言った。 今後、何開明氏のシンプルで率直な研究スタイルを学ぶ若い世代が出てくるのだろうか。 また、MITのような名門大学でさえ、産業界の研究所ほど豊富なGPUコンピューティングリソースを持っていないため、MITに入学した後もMeta氏と密接な関係を維持できるのではないかと期待する人もいた。 人々は称賛を表明するだけでなく、何開明氏の将来の科学研究の方向性を予測し始めた。彼の個人ウェブサイトの説明によると、「コンピュータービジョンの問題というレンズを通して、さまざまな分野に適用できる一般的な方法を開発することが私の目標です。私の現在の研究は、複雑な世界の表現を学習できるコンピューターモデルの構築と、複雑な世界に対する知能の探求に焦点を当てています。私の研究の長期的な目標は、より強力な人工知能を通じて人間の知能を高めることです。」 これは現実世界と対話する AI、ロボットを意味するのでしょうか? 注目の移籍何開明氏の行方は4か月前にAI分野で話題になった。 今年3月、MITのウェブサイトで特別講義のプレビューを多くの人が発見しました。
MITのEECSでは、このような「特別セミナー」は通常、職に応募しに来た学者による「面接」であり、その内容は主に求職者の研究成果を披露することである。予想外に、学術界のスターである何開明氏のための小さなイベントが、大規模なスターを追いかけるイベントに発展しました。イベント当日、会議室が満員になったため、MITは臨時に映写室を開放しなければなりませんでした。その結果、遠隔視聴用の部屋も満員でした。 画像はZhihuより これは人々がこの偉大な神を認識していることを示しています。 イベントに参加した学生によると、今回の講演で何凱明氏は主にResNet、Faster R-CNN、Mask R-CNN、MoCo、MAEなど自身の過去の研究を紹介したという。また、さまざまな科学分野の研究を支援する汎用ツールとしての AI や、自己教師あり学習のより広範な応用など、将来に向けたビジョンもある程度あります。 何開明氏はMIT訪問後、最近ニューヨーク大学とプリンストン大学で講演を行った。 大学入試トップスコアラーからトップAI科学者へ何開明氏は、私たち全員がよく知っている AI 科学者の一人であり、コンピューター ビジョンの分野では彼の名前を知らない人はいないでしょう。 2003年、何開明さんは広東省大学入学試験で標準得点900点で総合点1位を獲得し、清華大学物理学部基礎科学クラスに入学した。清華大学物理学部基礎科学クラスを卒業後、香港中文大学マルチメディア研究所に入学し、唐暁氏の指導の下で博士号取得を目指した。 He Kaiming 氏は 2007 年に Microsoft Research Asia のビジュアル コンピューティング グループでインターンシップを行い、Sun Jian 博士を指導者として指導しました。 2011 年に博士号を取得した後、He Kaiming は Microsoft Research Asia に研究者として入社しました。 2016年、Kaiming He は Facebook 人工知能ラボに入社し、それ以来ずっと研究科学者として活動しています。 何開明氏の研究は数々の賞を受賞した。 2009年、唐暁教授、孫建博士、当時博士課程の学生だった何開明が共同で完成させた論文「ダークプライマリに基づく単一画像ヘイズ除去技術」が、世界最高峰のコンピュータビジョンカンファレンスCVPRで最優秀論文賞を受賞しました。また、同カンファレンス設立以来25年間でアジアの学者が最高賞を受賞したのは初めてのことでした。 唐暁欧と何開明 2016年、He Kaiming 氏は ResNet で再び CVPR 最優秀論文賞を受賞しました。さらに、彼の論文の 1 つは CVPR2021 最優秀論文賞にノミネートされました。何凱明さんはMask R-CNNでICCV 2017の最優秀論文賞(Marr賞)も受賞し、その年の優秀学生論文の研究にも参加しました。 Google Scholarの統計によると、He Kaimingは合計73本の論文を発表しており、H指数は67です。 2023年7月現在、何開明氏の研究は46万回以上引用されており、年間10万回以上のペースで増加しています。 これはどの程度の大きさですか?つまり、MIT に入学すると、彼は専攻分野に関係なく、直ちに学内で最も多くの引用数を誇る学者になるのです。 開明は当時「傑作」を出版した。開明師匠の作品といえば、ResNetが最も有名です。この論文は7年前に発表され、現在までに17万回以上引用されています。 「画像認識のためのディープ残差学習」は、2016 年にトップ コンピューター ビジョン カンファレンス CVPR で最優秀論文賞を受賞しました。論文の著者4人、何開明、張向宇、任紹青、孫建は、現在では人工知能の分野でよく知られた人物だ。当時、彼らは全員、マイクロソフトリサーチアジアのメンバーだった。 もう一人の偉大な学者である Li Mu は、畳み込みニューラル ネットワークを使用している場合、ResNet またはそのバリエーションを使用している可能性は 50% あると述べました。 He Kaiming の残差ネットワーク (ResNet) に関する論文は、深層ネットワークの勾配転送問題を解決しました。この論文は、2019 年、2020 年、2021 年の Google Scholar Metrics ですべての研究分野にわたって最も引用された論文であり、最新のディープラーニング モデル (Transformers、AlphaGo Zero、AlphaFold など) の基本的な構成要素を確立しました。 今日の大規模モデルで使用されているトランスフォーマー エンコーダーとデコーダーにはすべて、ResNet から派生した残差リンクがあります。 「ResNet以降、100層以上のディープニューラルネットワークを効果的にトレーニングできるようになり、ネットワークを非常に深くすることができる」と唐暁氏は2023年世界人工知能大会でのスピーチで何開明氏の学術的貢献を称賛した。「何開明氏はニューラルネットワークをより深くし、Googleはニューラルネットワークの入り口を広げ、より深く、より大きくして、今日の大規模モデルとなった」 2021年11月、何開明氏は筆頭著者として「マスクオートエンコーダはスケーラブルな視覚学習者」と題する論文を発表し、優れた汎化性能を持つコンピュータービジョン認識モデルを提案しました。発表されるや否や、コンピュータービジョン界でも話題となりました。 AI分野の新参者として、私は探索プロセスにおける多くの重要な研究論文の主著者が何開明氏であることにしばしば驚かされます。何開明氏は長年この業界に携わっていますが、科学研究に対する彼の姿勢は常に基準とみなされてきました。彼が筆頭著者として発表する論文は毎年わずか数本ですが、それらはほぼ例外なく間違いなく重量級のものです。 また、私たちは何開明氏の仕事のスタイルに感心することがよくあります。画期的な論文でさえ、簡潔で読みやすいことが多いのです。彼は、トリックや不必要な証明を使わず、美しい直感だけを使って、最も直感的な方法で「シンプルな」アイデアを説明します。 学界に戻った今、Kaiming がさらに素晴らしい作品を発表してくれることを期待しています。 |
<<: 30% のトークンで SOTA パフォーマンスを達成、Huawei Noah 軽量ターゲット検出器 Focus-DETR が効率を 2 倍に
>>: LLM評価レビュー論文が出版され、3つの側面から包括的にまとめられ、データベースも掲載されている
Pythonは、コンパイル速度が超高速なオブジェクト指向プログラミング言語です。誕生から25年が経ち...
[51CTO.com からのオリジナル記事] 現在、機械学習テクノロジーをめぐっては多くの誇大宣伝が...
この記事は公開アカウント「Reading Core Technique」(ID: AI_Discov...
高速鉄道網がますます充実するにつれ、列車は人々が長距離を移動する際に好まれる交通手段となってきました...
OpenCV の創設者 Gary Bradski 氏らが最近、Kornia のレビューを公開しました...
コンピュータービジョン技術の急速な発展に伴い、機械学習はビデオゲーム業界、特に仮想現実の分野で広く使...
科学技術が発展するにつれ、人類への科学技術の貢献が徐々に明らかになってきています。現在、世界中の科学...
検索分野では、Google画像検索、Baidu画像検索、Taobaoの商品写真検索など、「類似画像・...
数年前なら、コンピューターが 10,000 個のニューロンの活動を同時に記録していたらニュースになっ...
編集者注: ディープラーニングの継続的な発展により、音声認識技術は大幅に向上し、人々の日常生活に多く...
4月23日、51CTO主催の「MetaConメタバーステクノロジーカンファレンス2022」がオンライ...
ビル・ゲイツ氏の暴露は機械学習コミュニティで話題となっている。 「GPT-5 は GPT-4 よりそ...
大規模な純粋テキストモデルが増加しており、マルチモーダル分野ではマルチモーダル対話の大規模モデルも登...