HuaweiとXiaomiの携帯電話を使ったDIY自律ナビゲーションロボット:わずか300元、チュートリアルはオープンソースで誰でも始められる

HuaweiとXiaomiの携帯電話を使ったDIY自律ナビゲーションロボット:わずか300元、チュートリアルはオープンソースで誰でも始められる

この記事はLeiphone.comから転載したものです。転載する場合は、Leiphone.com公式サイトにアクセスして許可を申請してください。

ロボットを作るとなると、多くの人は無意識のうちに「自分に代わって世界中の主要な囲碁大会に出場し、もっと賞金を獲得できる AlphaGo を作りたい!」と考えるでしょう。あるいは、ボストン ダイナミクスのロボット「アトラス」を手に入れましょう。這ったり、ジャンプしたり、宙返りしたりできます。また、重いものを持ち上げたり、肩をマッサージしたりすることもできます... とても素敵です! とても素敵です!

さて、ここで疑問が湧いてきます。このような強力なロボットを作るには、強力な技術、完全な設備、十分な人員が必要です。さらに、プロセスは複雑で、3~5年かかり、費用もかかります...なぜわざわざ?(手を広げて)

しかしつい最近、インテルの研究者であるマティアス・ミュラー氏とヴラドレン・コルトゥン氏は、わずか50ドル(約350元)を費やし、わずか数時間でロボットを製作しました。

このロボットはいったい何者なのでしょうか?次の図をご覧ください。

このロボットはかなり速く歩くんですか?彼女はかわいい女の子のように見えますか?

ああ、読み間違えました。青いミニ車輪付きマシンです。

なぜ「ロボット」と呼ばれるのでしょうか?賢い脳を持っているから、何が起こると思いますか?

私たちが手に持っていたのが携帯電話だとは思いもしませんでした!

また、OpenBot というかっこいい名前もあります。私たちは、愛情を込めて Bobo/「Bobo」というニックネームを付けます。以下のAI技術レビューでは、Boboの本当の姿を紹介しています。Leifeng.com

1. 奇跡の誕生

ロボット工学の分野には常に 2 つの大きな課題があります。1 つはアクセシビリティ、もう 1 つはスケーラビリティです。製造コストが高く、製造工程が煩雑なため、ロボットを一般大衆に普及させることは困難です。 Muller 氏と Koltun 氏は、ロボット技術におけるこれら 2 つの「障害」を解決するために OpenBot を研究しました。

彼らが共同で発表した論文「OpenBot: スマートフォンをロボットに変える」では、スマートフォンをロボットの頭脳として利用してロボットに電力を供給し、シンプルな3Dプリントシャーシで組み立てることで、わずか50ドルで、人を追跡し、リアルタイムの自律ナビゲーションを実行できるロボットを構築できると述べています。

OpenBot を構築するプロセスは複雑ではありません。ロボットにセンサー、コンピューティング機器、通信機器を装備し、オープン ソフトウェア エコシステムへのアクセスを提供するだけです。

上記のように、総コストは次のとおりです。3D プリントされたベース: 5 ドル、車輪 4 つ: 3.5 ドル、バッテリー 3 つ: 7 ドル、速度センサー 2 つ: 2 ドル、モーター ドライバー: 3 ドル、マイクロコントローラー: 8 ドル。

Bobo の頭脳として携帯電話が使用されている理由は、スマートフォンがますます高性能になり、カメラの品質やプロセッサの速度などの側面が継続的に向上しているためです。市販の携帯電話にも、慣性測定装置、GPS、Wi-Fi、Bluetooth、セルラーモデム、AI ニューラルネットワークモデルの推論用の専用チップが搭載されています。一部の携帯電話アクセサリはデスクトップ プロセッサよりも強力です。

研究者らは、主にセンシング、データ融合、コンピューティングに使用される電気機械本体にスマートフォンを挿入した。さらに、シャーシには最大 4 つのモーターを搭載でき、コントローラー、マイクロコントローラー、LED ライト、スマートフォン マウント、USB データ ケーブルを取り付けるためのスペースも残っています。

充電するには、バッテリー パックを専用の充電ポートに接続してモーターに電力を供給し、Andruino Nano ボード (使いやすいハードウェアとソフトウェアに基づくオープン ソースの電子プラットフォーム) を USB 経由でスマートフォンとペアリングして、シリアル通信リンクとロボットへの電力を供給します。

ロボットの2つの前輪には、距離測定信号を送信できるセンサーと、速度と方向をリアルタイムで調整するためのモーターに接続されたピンも装備されています。

Bobo のソフトウェア スタックも比較的シンプルで、シリアル リンクを介して通信する 2 つのコンポーネントのみで構成されています。オペレーターはスマートフォンに Android アプリをインストールし、アプリのインターフェースを使用して、より高度な認識および制御ワークロードを実行しながらデータセットを収集できます。さらに、Arduino上で動作するプログラムでは、簡単な運転や走行距離計、バッテリー電圧の測定なども行えます。

Android アプリをインストールすると、既存の Bluetooth 対応 PS4、Xbox、Switch、その他のゲーム コントローラーを通じて OpenBot を制御することもできます。コントローラーのボタンを機能するように設定でき、経路探索モデルでデータが収集および交換されます。これらのモデルには、ロボットの視界内にいる人を検知して追跡できる、使いやすい自律ナビゲーション モデルが含まれています。

組み立てプロセス全体も非常に簡単です。テーブルの前に座って「手を動かす」だけです。それほど器用でなくても、パズルを解く忍耐力があれば、おそらく完成できるでしょう。

こんな単純なロボットの効果は何でしょうか?


研究者らは、ミッドレンジのXiaomi Note 8、Huawei P30 Lite、Xiaomi Poco F1デバイスを使用してシステムをテストしました。上の図に示すように、これらのスマートフォンには専用のAIアクセラレータが搭載されているため、10フレーム/秒以上の速度で人間の活動を追跡できます。最も構成が劣る Nokia 2.2 でも、テスト時間の約半分の間、対象の人物を検出し、対象のオブジェクトを追跡することができました。

自律ナビゲーションタスク中、オフィスの廊下にある鉢植えを巧みに避けることもできました。

2. ステップバイステップのチュートリアルがオープンソースになりました

前述のように、携帯電話を除いたロボット全体のコストは50米ドル(350人民元)未満です。ロボットの本体は3Dプリントされた部品とスマートフォン(中古の携帯電話でも可)で作られています。

上の写真は筆者の車5台の部品の卸売価格を示している。

このロボットの背後にある技術は論文として公開されており、作者は製作手順もGitHubでオープンソース化している。関連部品の購入チャネルも提供しています。 3Dプリントの図面も公開され、3Dプリンターのパラメータ設定までもが示されました。


GitHub アドレス: https://github.com/intel-isl/OpenBot/tree/master/body

論文アドレス: https://arxiv.org/pdf/2008.10631.pdf

同時に、インストール プロセスに関する 20 の注意事項が示されており、これは、必要に応じてモーターにワイヤを接続する、速度センサーと超音波センサーを 5V と GND に接続する、など、良心的なステップ バイ ステップのチュートリアルと言えます。

この論文では、スマートフォンを使用する理由も紹介されており、スマートフォンの利点はハードウェア機能が急速に向上しているだけでなく、活気のあるソフトウェアエコシステムを備えていることであるとしている。

スマートフォンはカメラの品質とプロセッサの速度が向上し続けており、GPS、Wi-Fi、Bluetooth、セルラーモデム、AI推論用の専用チップが搭載されており、その一部はデスクトッププロセッサを上回る性能を発揮します。

小型電気自動車(ロボット)全体は2つの部分に分かれています。1つ目はハードウェアで、50ドルで作れる部品です。2つ目はソフトウェアスタックで、スマートフォンが自動車を車体として使用し、リアルタイムの認識と計算によるモバイルナビゲーションを実現する機能です。

ハードウェア構造には、機械設計と回路設計の 2 つの部分が含まれます。機械設計を下図に示します。

回路設計を下図に示します。上部にはバッテリー、モーター コントローラー、マイクロ コントローラー、速度センサー、インジケーター LED、スマートフォンが含まれ、下部には配線を減らすためのオプションのカスタム PCB が含まれます。

ソフトウェア スタックも、Android アプリケーションと Arduino プログラムの 2 つの部分で構成されます。その中で、Android アプリケーションはスマートフォン上で実行され、操作インターフェースの提供、データセットの収集、高度な認識および制御タスクの実行が可能です。 Arduino プログラムは、車輪の走行距離の測定やバッテリー電圧の監視など、低レベルの駆動と測定を担当します。

ソフトウェアとハ​​ードウェアが完成した後、インテルの研究者は、歩行者の追跡と自律ナビゲーションという 2 つのタスクを完了することを目指してロボットをトレーニングしました。

歩行者追跡タスクでは、研究者らは事前にトレーニングされた MobileNet バックボーンを備えた SSD オブジェクト検出器を使用しました。さらに、推論時間の影響を調査するために、著者らは MobileNet の 2 つの異なるバージョン、オリジナルの MobileNetV1 と最新の MobileNetV3 を使用しました。さらに、両方のモデルは COCO データセットでトレーニングされています。

運転戦略トレーニングプロセス

研究者らは、自律ナビゲーションタスクのために、条件付き模倣学習のコマンド入力版に似たニューラルネットワークを使用して、ほとんどのスマートフォンでリアルタイムに実行できる運転ポリシーをトレーニングしました。さらに、研究者らはこれを既存の運転ポリシーと比較し、必要なパラメータが約 1 桁少ない状態でベースラインと同様のパフォーマンスを達成しました。

OpenBot の登場により、世界中に数千台の低コストロボットが導入され、ロボット教育や大規模学習に新たな機会がもたらされると期待されています。

<<:  「万能AI」GPT-3の中国版を作る方法

>>:  ドローン技術はスマートシティの発展をどのように促進できるのでしょうか?

ブログ    
ブログ    

推薦する

AlphaGoの仕組み:マルチエージェント強化学習の詳細な説明

このレビュー記事では、著者はマルチインテリジェンス強化学習の理論的基礎を詳細に紹介し、さまざまなマル...

...

「映画を見る」こと以外に、人工知能は医療の分野で何ができるのでしょうか?

6月26日に開催されたセコイア・グローバル・ヘルスケア産業サミットで、スタンフォード大学のフェイフ...

顔認識技術のまとめ:従来の方法からディープラーニングまで

英国ハートフォードシャー大学とGBG社の研究者らは最近、顔認識のさまざまな従来の手法と現在流行してい...

人工知能:しっかりと根を張ってこそ、どこでも繁栄できる

人工知能(AI)技術は静かに人間の生活を変えています。顔認証、顔スワイプ決済、新型コロナウイルス感染...

AIは人間のための単なるツールだということをご存知ですか?

[[429689]]この記事は、ハーパー氏が執筆したWeChatパブリックアカウント「データとイン...

ビッグデータAIベースのセキュリティシステムにおける倫理的偏見

「機械は人間を攻撃できるか?」という疑問は、世界中の会議やソーシャルチャットの議論のテーブルで浮上し...

TorchCVは、北京大学の学生が開発したPyTorchベースのCVモデルフレームワークです。

機械学習によってもたらされたあらゆる破壊的技術の中でも、コンピュータービジョンの分野は業界関係者と学...

マイクロソフトとフェイスブックが共同で人工知能ソフトウェアを開発し、グーグルの主導的地位に挑戦

マイクロソフトはすでにオープンソースの人工知能ソフトウェアを持っています。しかしここ数カ月、マイクロ...

...

機械学習に関する7つの誤解

ディープラーニングを学ぶ過程では、私たちが当たり前だと思っているさまざまな噂やさまざまな「こだわり」...

大規模ニューラルネットワークに関する最新の文献のレビュー:効率的な DNN のトレーニングとメモリ使用量の節約

現代のディープラーニングおよび人工知能技術の開発には、ディープニューラルネットワーク (DNN) を...

生成型人工知能(GenAI)は将来のテクノロジーの展望を一変させる

ChatGPT の人気が高まるにつれ、生成型人工知能 (GenAI) がテクノロジー業界の未来を大き...

自律型 AI エージェント: 未来の生産性エンジン

翻訳者 | 崔昊レビュー | Chonglouまとめこの記事では、タスクを自ら作成し、優先順位を付け...

...