清華大学の趙明国氏:AIチップ+ロボット、アルゴリズムのボトルネックを突破

清華大学の趙明国氏:AIチップ+ロボット、アルゴリズムのボトルネックを突破

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

8月7日、2020年グローバル人工知能・ロボットサミット(CCF-GAIR 2020)が深セン前海OCT JWマリオットホテルで開幕しました。この会議は、中国コンピュータ連盟(CCF)が主催し、香港中文大学(深圳)とLeiphone.com(パブリックアカウント:Leiphone.com)が共催し、彭成研究所と深圳人工知能ロボット研究所が共催します。

2016年の産学融合、2017年の産業界の実現、2018年の垂直分断、そして2019年の中国人工知能40周年に至るまで、サミットは中国の人工知能とロボット工学の分野で最大かつ最高仕様で最も国境を越えた学術、産業、投資プラットフォームの構築に取り組んできました。

会議の取り決めによると、8月8日、「ロボティクスフロンティア特別セッション」において、清華大学の研究者でありUBTECHヒューマノイドロボティクスの主任科学者である趙明国教授が「計算ベースのインテリジェントロボット制御」と題する基調講演を行った。

[[337651]]

趙明国教授は、従来の制御システムでは、アルゴリズムの能力がコントローラによって制限されることが多いため、知能ロボットがマルチモーダル性を実現するのは非常に不便で、実現が難しいか、消費電力が大きく、サイズも大きいと述べた。AIチップをロボットに統合し、アルゴリズムと計算能力のサポートを提供すれば、ロボットの動作と知覚の問題を効果的に解決できる。

趙明国教授はスピーチの中で、最新のロボット事例である自動運転自転車を紹介した。このロボットは、複雑な現実世界の環境における速度の変化、さまざまな凹凸や材質の道路などの干渉要因に対処し、完全に自律的な動きを実現します。彼の意見では、自動運転自転車の実現には、次の 3 つの基本機能を満たす必要がある。

  • モーション制御: これは、組み込みシステム上で制御アルゴリズムを実行することによって実現されます。

  • 位置決めとナビゲーション: これは高周波システムでの反復計算によって実現されます。

  • インタラクションと認識: これは、認識またはアルゴリズムの推論に GPU 並列コンピューティングを使用することで実現されます。

その中で、対応する 3 つのアルゴリズム要件はすべてチップによって完了できます。趙明国教授は、無人自転車に「天極チップ」を組み込み、走行経路認識、障害物認識、音声ナビゲーション、動作制御など複数の機能を実現したと述べた。このチップは、清華大学のShi Luping教授のチームが昨年発表した脳のようなチップです。 3 つの異なるアルゴリズムを同時に実装でき、動的、定義可能、再プログラム可能です。

天吉チップによる無人自転車のデモンストレーションと検証に基づいて、趙明国教授は知能ロボットの将来の研究方向として2つの新しい道を提案しました。

チップ + ロボット: ロボットをチップと AI アルゴリズムの研究プラットフォームとして使用します。

ロボット + チップ: ロボット制御とインテリジェント アルゴリズムを実装するためのプラットフォームとしてチップを使用します。

彼の意見では、将来のインテリジェントロボットは必然的に人工知能技術と深く統合され、AIチップはロボット制御の分野でさらなる可能性を刺激するだろう。

趙明国教授は、無人自動車は地上での移動という基本的なタスクを完了しただけであり、次のステップは自転車が離着陸などの難しいスタントをいかにして達成できるかをさらに探究することだと述べた。彼の意見では、

制御の問題を極限まで追求し、テクノロジーの限界を探求することによってのみ、テクノロジー全体の進歩を促進することができます。私たちのビジョンは、ロボットが人間レベルの自転車操作に到達、あるいはそれを上回れるようにすることです。

さらに、趙明国教授は二足歩行ロボットに関する研究事例も紹介しました。同氏は、脚付きロボットであれ車輪付きロボットであれ、それらはアルゴリズムをテストするためのツールや運搬手段であり、最終製品が商品化されることはないと強調した。

会議後、Leifeng.comの編集者とのインタビューで、趙明国教授は、ヒューマノイドロボットは全体としてまだ学術研究の段階にあり、商業化にはまだ程遠いとも述べた。産業発展の観点から見ると、研究開発への投資額が高く、技術的な道のりが長いため、ヒューマノイドロボットの研究に注力している企業はほとんどありません。国の政策の支援を受けて、大学チームや一部の企業の研究開発チームが多くの作業を行っており、近年、画期的な研究成果が継続的に発表されています。

さらに、趙明国教授は、現在いくつかの新たな研究が検討されており、それに応じた結果が来年発表される予定であることを明らかにした。

以下は趙明国教授のスピーチの全文です。Leifeng.com(公式アカウント:Leifeng.com)の編集者が、原文の意味を変えずに編集・整理しました。

みなさんおはようございます!今日はロボットを作る際に遭遇した問題や考えたことを皆さんにシェアしたいと思います。私のテーマは「計算ベースのインテリジェントロボット制御」です。ロボット制御の過程では、コントローラを使用してさまざまなアルゴリズムを実装する必要がありますが、ここでは実際的な問題があります。つまり、コントローラの能力によってアルゴリズムの能力が決まります。長い間、コントローラーの限界を突破する方法がなく、アルゴリズムは比較的初級または中級の段階にとどまり、上級レベルに到達することは困難でした。そこで私たちは考え方を変え、アルゴリズムによってコントローラーの開発を推進することにしました。

ここでは、無人自転車と二足歩行ロボットの 2 つの実験ケースを行いました。

これら 2 台のロボットのうち 1 台は車輪付きで、もう 1 台は足付きであることに留意してください。私は実用性や商品化を目的に車輪付きロボットを作りませんでした。無人バイクは、アルゴリズムをテストしたり、特定の問題を解決したりするために使用する実験ツールです。同様に、二足歩行ロボットも研究実験を目的としています。それらの実用性は、その後の商業的開発を待つことになります。

天地チップで動く無人自転車

まず、自動運転車とは何かについてお話ししましょう。人間の制御なしに自律的に移動できる車を無人運転車と呼びます。ロボット自体には多くの力学原理が関わってきます。自転車は200年近く前に発明されたが、その機械的な仕組みはこれまで徹底的に研究されたことがなかった。2016年に学者グループがネイチャー誌に論文を発表し、初めてその複雑な動力学システムについてより徹底的に説明された。ロボットの制御を行う際には、自転車の運動原理も十分に活用する必要があります。

[[337652]]

人々は自転車を制御する能力が非常に高く、例えばキャンパス内や障害物のない道路では手を持たずに自転車に乗ることができます。では、自転車のバランスを保ちながら自律的に動くにはどうすればよいのでしょうか?実際、ここには多くの機械的な原理が関係しています。一般的に言えば、次のような影響要因があります。

  • 自転車が円形の軌道上を走ると遠心力が発生し、バランスを保つのに役立ちます。

  • 自転車の特殊なフロントフォーク構造、つまりフォークの角度と前輪のトレイル、これら 2 つの物理的パラメータの変化により、ハンドルが自動的にまっすぐになり、バランスが維持され、重要な役割を果たします。

  • 車両全体の質量がバランスよく分散されていることも、バランスを保つ理由の一つです。

  • 人が自転車に乗るとき、上半身の動きによって自転車のバランスを保つための反力が発生します。

  • 車輪のジャイロ効果とジャイロトルクは、車のバランスを保つのに役立ちます。

  • リアクションホイール(宇宙船でよく使用される)またはトルクジャイロを追加すると、バランス効果が得られます。

上記の最初の 2 つの項目は私たちの研究の方向性であり、真ん中の 3 つの項目は外部デバイスのインストールが必要であり、独立した自転車とは関係がなく、最後の項目は研究の原則とは無関係です。したがって、最初の 2 つの項目のみを選択しました。

最初の 2 つの項目を制御に使用すると、低速および可変速走行によって影響を受ける遠心力、風の干渉、大きな傾斜、荷重の変化、車輪とさまざまな表面との相互作用など、いくつかの困難に遭遇しました。

以下は比較的単純な自転車の動力学モデルで、車体、ハンドル、走行速度を3つの変数で記述できます。この3つの変数を記述すると、動力学方程式が得られます。この方程式は強い非線形性を持ち、異なる状態における角度と速度が連動しています。また、パラメータに対して非常に敏感です。

さらに、方程式内の多くのパラメータが速度に関連していることがわかります。速度が変化すると、動的方程式も変化します。これは私たちにとって興味深い課題です。速度の影響を解決できれば、制御アルゴリズムはさらに一歩前進できます。

ハンドルの一定速度での操舵制御は、通常の制御方法で解決できます。2年生と3年生は、一定速度の自転車の実験に挑戦してみるとよいと思います。私たちがやらなければならないのは、速度変化時のハンドル操舵バランス制御を解決することです。

これまで、可変速度制御を実現するために、速度推定+セグメント制御方式を採用しようとしてきました。当時、私たちは約20のパラメータを手動で調整するのに1か月以上を費やしました。速度の変化に応じて切り替えることで、車の安定性の問題をより適切に解決できます。その後、このデータを強化学習の初期パラメータとして使用すると、より良い効果が得られ、地面の材質に適応できるようになります。残念ながら、初期知識ゼロでの学習は成功しませんでしたが、セグウェイスクーターを使用して知識ゼロでの強化学習により、プラスマイナス 10 度の範囲内でバランスをとることができました。基本的に直線部分の知識しか学んでいなかったので、自転車では使いませんでした。したがって、「ブルートフォース」強化学習はこの問題には適していない可能性があり、さらなる調査が必要であると結論付けました。

当社の無人自転車は、後輪に駆動装置、前ハンドルにステアリング、ブレーキ、コントローラー、および対応する各種センサーとバッテリーを備えた通常の自転車であり、自転車は定速走行を実現できます。実際、どのコントローラもフィードバック制御によってある程度の堅牢性を備えているため、一般的な道路を走行する分には問題ありません。さまざまな速度でのパラメータが適切に一致していれば、スムーズな切り替えが実現でき、比較的良好な堅牢性を実現できます。

[[337654]]

さらに、可変速度での自動ナビゲーションも実現しました。これは清華大学のキャンパスで撮影した短編映画です。動画の自転車は、低速から高速まで、さまざまな凹凸や材質の道路を走行できます。路面認識用のセンサーを追加し、比較的単純な経路を走行することもできます。

無人自転車がこの効果を達成できるようにするために、私たちはいくつかのことを行いました。ロボット制御を実現するだけでなく、知覚モジュールも追加されており、これが私たちの動的モデルです。

図の 2 つの赤い円から判断すると、いくつかの用語はジャイロ効果に関連し、いくつかの用語は遠心力に関連し、いくつかの用語は構造に関連し、最初の最も重要な用語は重力に関連しています。これらの条件は速度によって異なります。

従来の方法は、NI コントローラーまたは任意の産業用コントローラーを使用し、多数のセンサーを統合してこの効果を実現することです。もちろん、このプロセスでは失敗することもあります。失敗してパラメータを再調整し、再度挑戦することがよくあります。しかし、これはロボット制御に対するかなり伝統的かつ複雑なアプローチです。

後でそんなことはしませんでした。従来、組み込みシステムでは制御アルゴリズムを実装する必要があるため、モーション制御タスクには組み込みシステムが必要でした。位置決めとナビゲーションを同時に行う場合、SLAM などの反復操作を実行するための高周波システムが必要です (SLAM は GPU 上で実行することもできます)。多くの場合、インタラクションと認識では、何らかの認識または推論アルゴリズムを実行するために GPU を使用する必要があります。つまり、並列コンピューティング、高頻度コンピューティング、リアルタイム要件に適しています。これら 3 種類のコンピューティングは、インテリジェント ロボットで同時に必要とされます。特にロボカップ大会に参加したとき、私たちが作ったヒューマノイドロボットは、こうした計算を同時に行う必要がありました。最も簡単な方法は、それぞれ異なる計算能力を持つ3台のコンピュータをネットワークケーブルで接続し、オペレーティングシステムを使用してデータ通信を維持することでした。

今回はそのアプローチは採用しませんでした。昨年、清華大学の石魯平教授のチームは、「天極チップ」と呼ばれる脳のようなチップを発表しました。これは、1つのチップで3種類のコンピューティングを実現できます。さらに、このチップは動的で、定義可能で、再プログラム可能です。これは、2つ以上の分野の交差点の結果です。チップを作る教師と協力し、これらの機能を備えたチップを使用して、テスト用の3つのタスクを完了しました。3つのタスクをすべて達成できれば、チップにはこれら3つのコンピューティング機能があることを意味します。

[[337655]]

これは従来のロボット制御ハードウェアでは実現が難しく、実現できたとしてもサイズが大きくなり、多くの電力を消費することが避けられません。そこで、この機能を実現するためにハイブリッド アーキテクチャ チップを使用したいと考えています。そこで、走行経路認識、障害物認識、音声ナビゲーション、動作制御のすべての機能を 1 つのチップ (もちろん 1 つのチップではなく、チップが配列されたマザーボード) に組み込みました。

上のアニメーションに示されているように、チップはすべてのコンピューティング機能を実装します。私たちの研究成果は、昨年8月1日にネイチャー誌に掲載されました。ネイチャー誌に掲載された我が国の人工知能分野の研究論文としては初のものでした。

この研究に触発され、天吉チップを使用した無人自転車のデモンストレーションと検証は、自動運転ロボットの研究開発に新たなアイデアを提供します。その方法は2つあります。

  • チップ + ロボット: ロボットをチップまたは AI アルゴリズム研究プラットフォームとして使用して、アルゴリズムの実現可能性を証明します。アルゴリズムが進歩するにつれて、それがロボットにフィードバックされ、最終的には高い計算能力やマルチパフォーマンスチップの実現が促進されます。

  • ロボット + チップ: チップを使用して、ロボットの計算能力不足の問題を解決します。

この新しいアイデアは、2016年にScience誌に掲載された記事の中で張北教授によって初めて言及されました。その目的は、人工知能技術とロボットを組み合わせて、お互いを促進し合うことを期待することです。

現在、この研究成果は国際的に有名な雑誌や専門家からも認められています。さらに、ネイチャー誌の編集者が、ネイチャー誌に掲載される論文のレポート数は通常は100件だが、私たちの論文のレポート数は1,400件に達し、これまでで最高だと語っていたことも特筆に値します。

コンピューティングパワーが支える技術的課題

今のところ、ロボットの制御とコンピューティング能力に対する需要はまだまだあります。YouTube の動画では、山岳クロスカントリーのチャレンジがよく見られます。これらの動画は、人間が自動車を制御できる能力がいかに強力であるかを証明するのに十分です。

[[337656]]

私たちのビジョンは、ロボットが人間レベルの自転車操作に到達、あるいはそれを上回れるようにすることです。これにより、制御の問題を限界まで押し進めることができ、技術の限界を発見し、技術全体の進歩を促進できるからです。長期的には、将来のロボット制御は次の 3 つの開発段階に分けられます。

ステージ 1: 自転車は低速、可変速度、荒れた路面や障害物のある路面でも正常に移動できます。

第2段階:自転車は離陸や着陸などのスタントを自力で完了することができます。

フェーズ 3: 実際のアプリケーションでは、制御システムと認識システムを統合した自転車は、極限の山岳アスリートのように複雑な環境でも自由に移動できます。

初期段階のタスクは完了しましたが、中期および長期のタスクについてはまだ明確な計画はありません。ただし、これらのタスクの実現には強力なコンピューティングのサポートが必要であることは確かです。コンピューティングがなければ、他の部分がどれだけうまくいっても、目標は達成されません。

二足歩行ロボットの受動歩行理論

ロボットの受動歩行の理論は、1990 年代に早くも提案されました。当時のロボットは純粋に機械的な構造であり、初期条件さえ与えられれば安定した歩行が可能であった。 2005年までにコーネル大学の研究チームは受動歩行の理論に基づいて人間と同等の歩行ロボットを開発しました。この研究結果がサイエンス誌に掲載されると、大きな反響を呼びました。それ以来、受動理論に関する拡張研究が数多く発表されています。しかし、ハーバード大学が開発したロボット用ソフト外骨格以外には、実用価値をもたらす研究成果はほとんどありません。

外骨格研究は近年注目されている研究分野であり、国内にはこれを研究している企業が数十社ある。機能障害や特殊職業に就く人々にとって、それは確かに一定の実用的な価値を持っています。これらの結果を見て、私たちは関連する理論に興味を持ちました。

人間の歩行とは一体何でしょうか?多くの医学者は、人間の歩き方を分析した後、記録された歩行軌跡が絡み合った混乱のようなもので、周期的ではあるが反復的ではないことを発見しました。最初は、ノイズや不均一な歩き方によるものだと考えられていましたが、最終的に、人々は実際には無秩序な歩き方をしていることがわかりました。 1998 年に、パラメータが特定の値に変化すると、パッシブ モデルがカオス特性を示すことが発見され、後に実際のオブジェクトでこれが確認されました。

たとえば、受動理論を使用して脚付きロボットを作成したところ、その歩行データは明らかなカオス的な傾向を示しました。それで疑問なのは、人間が無秩序に歩くのに、なぜロボットは単一周期で歩くのかということです。

TED には、パーキンソン病の患者が階段を上り下りするときに手すりをつかまなければならないビデオがあります。その後、彼の孫娘が平らな地面に何層もの階段を描く実験を行いました。その結果、患者は手すりなしでも自力で歩くことができるようになりました。もちろん、これはパーキンソン病のメカニズムに関連していますが、ダイナミクスにも関連していることを示しています。パーキンソン病の本質は、神経系における局所的な障害と伝導障害の存在です。この症例は、視覚刺激を通じて神経系の正常な機能を回復させることでこの問題が解決できる可能性があることを示しています。

従来の歩行ロボットは、単一サイクルの歩行に従って制御されます。解決すべき最初の問題は安定性ですが、人間の歩行は乱雑になる可能性があります。受動的な歩行から人間の歩行の動的な説明を見つけ、そのダイナミクスを使用してロボットや歩行器のパフォーマンスの制御方法を改善することはできるでしょうか?カオスの特性に応じて制御すると、まったく異なる結果が得られる可能性があります。ここでは、動的軌跡のいくつかのケース分析を行います。以下のように表示されます。

SK から始まり、円を描いて回り、次の着陸状態に戻るというサイクルが循環的に繰り返されます。 S0 から始まり、次の着地は S1、S2、S3、S4 です。赤い点は最終目的地で、安定した値です。シングルサイクルの歩行は一貫しており、これは私たちのシステムと非常に似ています。このパラメータをシステムに与えると、システムは最終的に赤い点に落ちます。システムに別のパラメータを与え、赤いパラメータを使用してシステムを欺くと、結果として、2 番目のステップまたは特定のステップを実行するときに、赤い領域の近くを通過することになります。明らかに、ターゲットの赤い点については、黒のパラメータ自体(段階的な収束プロセスを持つ)ではなく、赤のパラメータを使用する方が適切です。

偽のターゲットを使って騙す場合、どのターゲットを騙すのがより良いかを検討する必要があります。ここでは多くの計算を行う必要があります。まず、赤い軌道とすべての可能な黒い軌道が何であるかを把握し、それらをすべて計算し、最も最適化された軌道を選択してから、パラメータをシステムに送信する必要があります。最後に、このシステムは、従来の現代制御理論における状態方程式のフィードバック制御問題と同等です。

この方法は、カオス制御における最も古典的な OGY 法から派生したものです。ここでは、MPC 法を提案し、大量の計算による MPC が従来の OGY 法よりもはるかに優れていることを発見しました。さらに、ロボットが転倒しそうになった場合、コンピューターが適切な軌道を見つけて動きを再開できるため、安定の範囲が大幅に広がります。

[[337657]]

現時点ではオンラインでの計算や予測は実現できませんが、5セットのパラメータのみで実験を実施しています。つまり、あらかじめパラメータの異なる5組の歩容を計算しておき、それぞれのパラメータは安定した周期歩容、つまり5組の異なる速度(草地、坂道、石畳など5つの異なる経路)に対応しており、計算によって軌道を切り替えることで安定性を実現できるのです。これは、当社独自のブルートフォース安定性強化方法とは異なります。私たちの制御量は、制御システムの特定の指標ではなく、制御パラメータのみです。指標が変化すると、入力量を変更する代わりにパラメータを変更します。パラメータの変更は、各関節のモーターに伝達されます。これにより、従来の制御とは異なる代替結果が生成され、パラメータ励起方式に​​なります。

さらに、私たちは本物の二本足と二本の腕を持つヒューマノイドロボットも作りました。これも計算方法に厳密に依存する必要があります。最終的な結果はまだ得られていませんが、最終的な効果を今後お見せする機会があります。

本日の報告は以上です。皆様ありがとうございました!

<<:  フォークス写真ツール:顔認識システムを密かに汚染

>>:  AIoT: 人工知能 (AI) とモノのインターネット (IoT) が出会うとき

ブログ    

推薦する

2024年のITトレンド、予測、推奨事項

2024 年は、人工知能 (AI) を先頭に、革新的なテクノロジーにとってエキサイティングな年となる...

最高のビジネス インテリジェンス ソフトウェア: ビジネス インテリジェンス ツールの比較

ビジネス インテリジェンス (BI) およびデータ分析ツールは、さまざまなデータ ソースを単一のプラ...

アマゾンのドローン配送部門の主要メンバーが目標未達成で辞任

アマゾンのドローン配送部門プライムエアで安全、飛行運用、規制業務を担当していたショーン・キャシディ氏...

米国労働統計局は機械学習を使用してデータコーディングを自動化しています

政府機関には常にさまざまな文書が詰まっていますが、その多くは紙の文書であり、電子文書であっても、実際...

...

500以上の研究と50以上のモデルを網羅したコードビッグモデルレビューがここにあります

BERT や GPT などの事前トレーニング済みのトランスフォーマーの登場により、言語モデリングは近...

今後5年間の産業AIの8つの主要な発展トレンド

ChatGPT と生成型人工知能 (AI) が世間の注目を集めるようになり、突如として世界で最も議論...

AIメモリに与える8つの優れたオープンソースの無料ベクターデータベース

今年、AI大規模モデルの応用は爆発的な成長を遂げました。その中でも、LangChainやHaysta...

平昌オリンピックに向けたパイロットプロジェクトとして5Gバスとドローンがデビュー

[51CTO.com オリジナル記事] 韓国 IT ブリーフィング (3 月第 3 週)今回のKor...

人工知能とモノのインターネットの動的統合の探究(I)

AI と IoT の統合により、私たちの日常生活に新たな効率、自動化、インテリジェンスがもたらされ...

AIが仕事や生活を奪ったら、人類の未来はどうなるのでしょうか?

AIの発展は、人間の仕事の効率を向上させ、人間の働き方を変え、さらには人類の発展の方向を導く上で大...

自然言語処理シーケンスモデル——HMM隠れマルコフモデル

前回の記事では、主にテキストコーパスの抽出と前処理のプロセスについて説明しました。次のステップは、コ...

世界ロボット会議は、未来がここにあることを伝えます。

「リラックスして、直立不動で、右を向いてください!」司会者の指示に従い、一列に並んだロボットが一斉...

...

...