超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

超強力なTP-Link!北京大学と清華大学が共同で一般AI実験クラスを設立、朱松春氏が指導

史上最強の集団が力を合わせてAI開発に挑む?

最近、北京大学の公式Weiboアカウントは、北京大学と清華大学が共同で一般人工知能実験クラスを開始すると発表した。

チームリーダーは、昨年中国に帰国したAIビジョンの第一人者、朱松春教授に他ならない。朱教授は現在、北京大学人工知能研究所の所長兼主任教授であり、清華大学の基礎科学科の主任教授も務めている。

[[395930]]

報道によると、北京大学総合人工知能実験クラスに入学した第一陣の学生26人は北京大学元培学院の出身で、今年の春学期に授業が始まった。清華大学の総合人工知能実験クラスはオートメーション学部にあり、すでに第一陣の入学受付を開始しており、入学予定者は30人だという。

北京大学と清華大学、最強同盟からどんなAIの火花が生まれるのか?

清華大学と北京大学を「競っている」朱松春は、コンピュータービジョンの最高賞を3回受賞した。

4月25日、北京大学の郝平学長は清華大学110周年記念式典でのスピーチの中で、両大学が最近協力して朱松春教授が率いる汎用人工知能実験クラスを設立したと述べた。

北京大学一般クラスは元北学院にあり、今年の春学期から授業が始まりました。清華大学一般クラスはオートメーション学部にあり、現在学生の募集を開始しています。

[[395931]]

誰もがこれに自信満々だ。北京大学と清華大学の金字塔に加え、チームリーダーの朱松春が最強の保証人だ。では朱松春とは誰なのか?

[[395932]]

朱松春は、1996 年にハーバード大学でコンピューター サイエンスの博士号を取得しました。国際的な数学の巨匠である David Mumford 教授の下で学びました。国際的なトップ ジャーナルや会議で 300 本以上の論文を発表し、コンピューター ビジョンの分野で最高の国際賞である Marr Prize を 3 回受賞しています。

彼はコンピュータービジョンに関して独自の見解を持ち、視覚的常識推論やシーン理解などの認知科学の分野で重要な貢献をしてきました。

昨年中国に帰国した際、私は白熱した議論を巻き起こし、国内で温かい歓迎を受けました。

朱松春自身は、「国家が歴史を忘れれば、その未来を失う運命にある」という一文を信じている。

この文章はコンピュータービジョンについても考えさせられるものです。

[[395933]]

彼は、視覚に関する新しく発表された多くの論文の中で、5年前の文献を引用しているものはほとんどないと述べました。その代わりに、過去2年間のarxivの記事を引用し、いくつかのベンチマークと比較しています。

10 年、20 年、あるいは 30 年前の論文を真剣に読む人はほとんどいませんが、当時のアイデアやフレームワークの一部は、現在の研究にとって依然として大きな意味を持ち、ほとんどすべての人が小数点よりも高い精度を得るために同じ方法を使用しています。

誰もが非常に近視眼的で、過去数年間の歴史と人気の方法だけに焦点を当てており、この分野を継承することができません。特に、現在の手法の波が衰退した後、このグループの人々は徐々に基盤と創造性を失っていくでしょう。

彼は自身の学歴について語り、デイビッド・マーが自分に最も大きな影響を与えたと信じている。

1960 年代の初めには、すでに多くの人が視覚神経生理学と心理学を研究しており、エッジ検出に関する研究を行っている人もいました。しかし、コンピュータービジョンはどのような問題を解決するのでしょうか?どうやってそれを達成するのでしょうか?皆の意見は分かれ、明確な結論に達することができませんでした。

David Marr は問題を計算 (実際には表現と言うべきでしょう)、アルゴリズム、実装という 3 つのレベルに分割しました。

まず表現レベルで、数学の問題としてどのように書くか。ミッションは何ですか?出力は何ですか?これは問題を解決するためのアプローチとは無関係です。

第二に、この数学の問題を解くときに、並列または直列でさまざまなアルゴリズムを選択できます。

繰り返しになりますが、アルゴリズムをハードウェアに実装する方法は、CPU、DSP、またはニューラル ネットワークを使用して実装できます。

さらに、David Marr 氏は、ビジョンが何を計算するのかについても明確にしました。

マールは、原始的なスケッチから 2 1/2D スケッチ、3D スケッチまで、一連の表現を提案しました。

これには、テクスチャ、ステレオビジョン、モーション分析、表面形状なども含まれます。 Marr 氏は、ビジュアル コンピューティングは単にソリューションを見つけることではなく、継続的なコンピューティング プロセスであると考えています。よく見て考えれば考えるほど、理解が深まる可能性があります。

マーが 1978 年の冬に急性白血病と診断されたことは特筆に値します。余命が長くないことを知ったマーは、急いで「視覚: 人間の視覚情報の表現と処理に関する計算的観点」という本をまとめました。彼は 35 歳で亡くなりました。

Zhu Songchun 氏と彼の同僚はこの本の作成に 8 年を費やし、テクスチャ、画像プリミティブ、プリミティブなシンプル画像など、Marr 氏の初期の視覚概念を統一された数学モデルに変換しました。

それ以来、視覚は純粋に理論的かつ計算的な観点から研究されるようになりました。

朱松春氏は、視覚の統計モデル化と計算理論に加えて、パターン認識の創始者である傅景孫氏の構文パターン認識理論を拡張し、画像やシーンを解析するための計算フレームワークも実装しました。

2010年以来、チュー氏はコンピュータービジョンを認知科学、自然言語理解、ロボット工学などの分野と組み合わせ、感覚入力では観察できない知能の95%、いわゆる「人工知能のダークマター」を研究してきた。

現在、Zhu Songchun 氏のチームは、日常のさまざまなタスクの実行を担う自律型 AI エージェントのトレーニングとテストを行うための大規模で物理的にリアルな VR/AR 環境を構築しました。

これらのエージェントは、視覚、言語、認知、機械学習、ロボット工学などの分野の機能を統合し、その過程で身体的および社会的常識を開発し、認知アーキテクチャを使用して人間とコミュニケーションをとることができます。

朱松春教授を知る人々は、彼の厳格な学問精神を賞賛することを躊躇しません。

なぜ汎用人工知能の人材を育成する必要があるのでしょうか?

「人工知能は1956年に始まった新興分野です。当時の目標は汎用人工知能でした。人々は、仮想キャラクターや物理的なロボットなど、さまざまなインテリジェントエージェント(AIエージェント)の研究を望んでいます。このインテリジェントエージェントには、自律的な知覚、認識、意思決定、学習、実行、社会的コラボレーションの能力が必要です。また、人間の感情、倫理、道徳観念にも適合する必要があります。これが汎用人工知能です。」と朱松春氏は紹介した。

朱松春氏はかつて、人工知能システムは3つの要素によって決定されることが多いと述べました。1つ目はアーキテクチャ、つまり知能、2つ目は環境データ、3つ目はタスクです。

[[395934]]

これには 3 つのレベルのソリューションが含まれます。最初のレベルのソリューションは、現在人気のビッグ データ + ディープラーニングです。2 番目のレベルのソリューションはタスクの理解です。3 番目のレベルのソリューションは、物理的推論と人間の実用的な価値選択です。

彼は、真にタスク中心になるためには、コンピュータービジョン、認知科学、言語対話、機械学習、ロボット学習という 6 つの主要分野を統合した統一システムを構築する必要があると考えています。

汎用人工知能は、今後 10 ~ 20 年間、国際的な人工知能研究の最前線となり、競争の焦点となるでしょう。朱松春氏は汎用人工知能分野の重要な戦略的意義を強調し、「国家安全保障と経済発展の観点から、これは極めて重要な分野だと考えている。中国が国際競争に参加するための戦場でもある」と述べた。

朱松春氏の今回の中国への帰国は、国内の人工知能、特に汎用人工知能の発展に大きな推進力をもたらすだろう。彼はまた、「人工知能の大統一理論」という自身の夢に一歩近づいた。

<<:  機械学習エンジニアに必要な 5 つのソフトスキル

>>:  ドローン配送がレイアウトブームを巻き起こす、普及するには2つのポイントに注意が必要

ブログ    
ブログ    

推薦する

Python はとても使いやすいです! AI初心者でもすぐに顔検出を体験

[[423040]] Pythonを使用してAI認識テストを実行します。具体的な方法は、リアルタイム...

インターネット大手が一斉に禁止、AIによる顔の改造はどこまで可能か?

​​昨年、微博で話題になった動画を覚えている人はどれくらいいるだろうか。『射雁英雄伝』で朱茵娜が演じ...

CCS Insight の予測: 生成 AI は 2024 年までに人気がなくなる

あるアナリスト会社は、生成型AIという熱狂的な分野にとって来年は現実を突きつけられる年になると予測し...

...

機械学習トレーニングデータ戦略を開発するための 6 つのヒント

人工知能 (AI) と機械学習 (ML) は今や当たり前のものとなっています。 AI は人間の認知を...

...

誰もがエンドツーエンドに取り組んでいますが、エンドツーエンドの自動運転の基礎は何でしょうか?

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

追加データなしで、ImageNetで初めて87.1%の精度を達成した。Yan ShuichengのチームはVOLOをオープンソース化した。

[[407987]]過去 10 年間、コンピューター ビジョン認識タスクは畳み込みニューラル ネッ...

人工知能統計調査:消費者の86%が手動の顧客サービスを好む

AI の健全性と進歩に関する最近の調査、研究、予測、その他の定量的評価では、米国の消費者がチャットボ...

携帯電話の顔認識はどのように機能しますか?理解を助ける記事

顔認証は一般的な生体認証の一種です。指紋認証と比較すると、顔スキャンは操作が簡単で、前面カメラを顔に...

AIが絵の描き方を教えてくれる

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

SEO技術における人工知能の応用

[[188760]] SEO はますます「難しく」なっていると誰もが感じているはずです。すでに、SE...

上位985大学の「人工知能」関連学部・専攻一覧!ぜひ集めてみてください!

今最もホットな分野といえば、間違いなく「人工知能」でしょう。給与面でも人材ギャップの面でも、この分野...

...