超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

史上最強の集団が力を合わせてAI開発に挑む?

最近、北京大学の公式Weiboアカウントは、北京大学と清華大学が共同で一般人工知能実験クラスを開始すると発表した。

チームリーダーは、昨年中国に帰国したAIビジョンの第一人者、朱松春教授に他ならない。朱教授は現在、北京大学人工知能研究所の所長兼主任教授であり、清華大学の基礎科学科の主任教授も務めている。

[[395930]]

報道によると、北京大学総合人工知能実験クラスに入学した第一陣の学生26人は北京大学元培学院の出身で、今年の春学期に授業が始まった。清華大学の総合人工知能実験クラスはオートメーション学部にあり、すでに第一陣の入学受付を開始しており、入学予定者は30人だという。

北京大学と清華大学、最強同盟からどんなAIの火花が生まれるのか?

清華大学と北京大学を「競っている」朱松春は、コンピュータービジョンの最高賞を3回受賞した。

4月25日、北京大学の郝平学長は清華大学110周年記念式典でのスピーチの中で、両大学が最近協力して朱松春教授が率いる汎用人工知能実験クラスを設立したと述べた。

北京大学一般クラスは元北学院にあり、今年の春学期から授業が始まりました。清華大学一般クラスはオートメーション学部にあり、現在学生の募集を開始しています。

[[395931]]

誰もがこれに自信満々だ。北京大学と清華大学の金字塔に加え、チームリーダーの朱松春が最強の保証人だ。では朱松春とは誰なのか?

[[395932]]

朱松春は、1996 年にハーバード大学でコンピューター サイエンスの博士号を取得しました。国際的な数学の巨匠である David Mumford 教授の下で学びました。国際的なトップ ジャーナルや会議で 300 本以上の論文を発表し、コンピューター ビジョンの分野で最高の国際賞である Marr Prize を 3 回受賞しています。

彼はコンピュータービジョンに関して独自の見解を持ち、視覚的常識推論やシーン理解などの認知科学の分野で重要な貢献をしてきました。

昨年中国に帰国した際、私は白熱した議論を巻き起こし、国内で温かい歓迎を受けました。

朱松春自身は、「国家が歴史を忘れれば、その未来を失う運命にある」という一文を信じている。

この文章はコンピュータービジョンについても考えさせられるものです。

[[395933]]

彼は、視覚に関する新しく発表された多くの論文の中で、5年前の文献を引用しているものはほとんどないと述べました。その代わりに、過去2年間のarxivの記事を引用し、いくつかのベンチマークと比較しています。

10 年、20 年、あるいは 30 年前の論文を真剣に読む人はほとんどいませんが、当時のアイデアやフレームワークの一部は、現在の研究にとって依然として大きな意味を持ち、ほとんどすべての人が小数点よりも高い精度を得るために同じ方法を使用しています。

誰もが非常に近視眼的で、過去数年間の歴史と人気の方法だけに焦点を当てており、この分野を継承することができません。特に、現在の手法の波が衰退した後、このグループの人々は徐々に基盤と創造性を失っていくでしょう。

彼は自身の学歴について語り、デイビッド・マーが自分に最も大きな影響を与えたと信じている。

1960 年代の初めには、すでに多くの人が視覚神経生理学と心理学を研究しており、エッジ検出に関する研究を行っている人もいました。しかし、コンピュータービジョンはどのような問題を解決するのでしょうか?どうやってそれを達成するのでしょうか?皆の意見は分かれ、明確な結論に達することができませんでした。

David Marr は問題を計算 (実際には表現と言うべきでしょう)、アルゴリズム、実装という 3 つのレベルに分割しました。

まず表現レベルで、数学の問題としてどのように書くか。ミッションは何ですか?出力は何ですか?これは問題を解決するためのアプローチとは無関係です。

第二に、この数学の問題を解くときに、並列または直列でさまざまなアルゴリズムを選択できます。

繰り返しになりますが、アルゴリズムをハードウェアに実装する方法は、CPU、DSP、またはニューラル ネットワークを使用して実装できます。

さらに、David Marr 氏は、ビジョンが何を計算するのかについても明確にしました。

マールは、原始的なスケッチから 2 1/2D スケッチ、3D スケッチまで、一連の表現を提案しました。

これには、テクスチャ、ステレオビジョン、モーション分析、表面形状なども含まれます。 Marr 氏は、ビジュアル コンピューティングは単にソリューションを見つけることではなく、継続的なコンピューティング プロセスであると考えています。よく見て考えれば考えるほど、理解が深まる可能性があります。

マーが 1978 年の冬に急性白血病と診断されたことは特筆に値します。余命が長くないことを知ったマーは、急いで「視覚: 人間の視覚情報の表現と処理に関する計算的観点」という本をまとめました。彼は 35 歳で亡くなりました。

Zhu Songchun 氏と彼の同僚はこの本の作成に 8 年を費やし、テクスチャ、画像プリミティブ、プリミティブなシンプル画像など、Marr 氏の初期の視覚概念を統一された数学モデルに変換しました。

それ以来、視覚は純粋に理論的かつ計算的な観点から研究されるようになりました。

朱松春氏は、視覚の統計モデル化と計算理論に加えて、パターン認識の創始者である傅景孫氏の構文パターン認識理論を拡張し、画像やシーンを解析するための計算フレームワークも実装しました。

2010年以来、チュー氏はコンピュータービジョンを認知科学、自然言語理解、ロボット工学などの分野と組み合わせ、感覚入力では観察できない知能の95%、いわゆる「人工知能のダークマター」を研究してきた。

現在、Zhu Songchun 氏のチームは、日常のさまざまなタスクの実行を担う自律型 AI エージェントのトレーニングとテストを行うための大規模で物理的にリアルな VR/AR 環境を構築しました。

これらのエージェントは、視覚、言語、認知、機械学習、ロボット工学などの分野の機能を統合し、その過程で身体的および社会的常識を開発し、認知アーキテクチャを使用して人間とコミュニケーションをとることができます。

朱松春教授を知る人々は、彼の厳格な学問精神を賞賛することを躊躇しません。

なぜ汎用人工知能の人材を育成する必要があるのでしょうか?

「人工知能は1956年に始まった新興分野です。当時の目標は汎用人工知能でした。人々は、仮想キャラクターや物理的なロボットなど、さまざまなインテリジェントエージェント(AIエージェント)の研究を望んでいます。このインテリジェントエージェントには、自律的な知覚、認識、意思決定、学習、実行、社会的コラボレーションの能力が必要です。また、人間の感情、倫理、道徳観念にも適合する必要があります。これが汎用人工知能です。」と朱松春氏は紹介した。

朱松春氏はかつて、人工知能システムは3つの要素によって決定されることが多いと述べました。1つ目はアーキテクチャ、つまり知能、2つ目は環境データ、3つ目はタスクです。

[[395934]]

これには 3 つのレベルのソリューションが含まれます。最初のレベルのソリューションは、現在人気のビッグ データ + ディープラーニングです。2 番目のレベルのソリューションはタスクの理解です。3 番目のレベルのソリューションは、物理的推論と人間の実用的な価値選択です。

彼は、真にタスク中心になるためには、コンピュータービジョン、認知科学、言語対話、機械学習、ロボット学習という 6 つの主要分野を統合した統一システムを構築する必要があると考えています。

汎用人工知能は、今後 10 ~ 20 年間、国際的な人工知能研究の最前線となり、競争の焦点となるでしょう。朱松春氏は汎用人工知能分野の重要な戦略的意義を強調し、「国家安全保障と経済発展の観点から、これは極めて重要な分野だと考えている。中国が国際競争に参加するための戦場でもある」と述べた。

朱松春氏の今回の中国への帰国は、国内の人工知能、特に汎用人工知能の発展に大きな推進力をもたらすだろう。彼はまた、「人工知能の大統一理論」という自身の夢に一歩近づいた。

<<:  機械学習エンジニアに必要な 5 つのソフトスキル

>>:  ドローン配送がレイアウトブームを巻き起こす、普及するには2つのポイントに注意が必要

ブログ    
ブログ    
ブログ    

推薦する

EasyDLコンピューティング機能:10種類以上のチップをサポートし、速度が数倍速く、ワンクリックで展開可能

科学研究、金融、小売から工業、農業まで、ますます多くの業界やビジネス シナリオで、効率の向上とコスト...

Dynatrace のフルスタック AI モニタリングは、企業が AWS クラウドで飛躍するのを助けます

2018 年 10 月 31 日、上海 - 世界有数のソフトウェア インテリジェンス企業である Dy...

周明氏との対話: ラストマイルを解決するために大きなモデルを使用するときは、理想主義にならないでください。

ゲスト | 周明執筆者 | Yun Zhaoある夜、湘源の湧き水が、広大で無限に湧き出しました。 C...

ボストンダイナミクスの犬は48万8000元。美しい女性がビーチで犬を散歩させている。ネットユーザーから「金持ち」と呼ばれる

太陽の光、美しさ、ビーチ、他に何が思い浮かびますか?写真にボストンのロボット犬がいると言ったら、想像...

企業における機械学習の導入を妨げる4つの障害

[51CTO.com クイック翻訳] 機械学習には多くの利点があるのに、なぜ誰もが導入しないのでしょ...

Uni-TTS音声合成モデルのアップグレード:1つの音声、複数の言語、高忠実度、高効率

最近、マイクロソフトは最新の Azure ニューラル ネットワーク音声合成技術 Uni-TTSv3 ...

2020年、全国の産業用ロボット出荷台数は前年比19.1%増加した。

工業情報化部が発表したデータによると、2020年1月から12月まで、全国の産業用ロボットの生産台数は...

マイクロソフト、NvidiaとIntelに対抗する2つのカスタムAIチップをリリース

マイクロソフトは最近、シアトルで開催されたIgniteカンファレンスで2つのAIチップをリリースした...

PubDef: パブリックモデルを使用した転送攻撃の防御

翻訳者 |ブガッティレビュー | Chonglou敵対的攻撃は、機械学習システムの信頼性とセキュリテ...

...

画像内のテキストを心配する必要はありません。TextDiffuserは高品質のテキストレンダリングを提供します。

近年、テキストから画像への変換の分野は、特に AIGC (人工知能生成コンテンツ) の時代において大...

Googleの研究者が自撮りカメラ用の顔歪み防止アルゴリズムを開発

最近の調査によると、毎日 9,300 万枚の自撮り写真がソーシャル メディアに投稿されており、Ins...

...

...

...