エッジAIの夢と課題

エッジAIの夢と課題

この記事では、AI を「小型マシン」に実装する根拠と、AI 小型マシンの開発で直面する課題という 2 つの主な質問に焦点を当てます。

将来、人工知能に関しては、空飛ぶ車やロボット執事が登場するはずです。私たちに反抗することを決意した知覚力のあるロボットに遭遇する可能性もあります。まだそこまでには至っていませんが、人工知能 (AI) テクノロジーが私たちの世界に入り込んできたことは明らかです。

スマート音声アシスタントに何かを依頼するたびに、機械学習テクノロジーがまずユーザーの発言内容を理解し、ユーザーが望む動作について最適な判断を下そうとします。たとえば、動画サイトや電子商取引プラットフォームが「あなたにおすすめな映画」や「あなたに必要な商品」を勧めるたびに、複雑な機械学習アルゴリズムに基づいて、できるだけ説得力のある提案を行おうとします。これは明らかに、過去のプロモーションよりも魅力的です。

私たち全員が自動運転車を所有しているわけではないかもしれませんが、私たちはこの分野の発展と自律ナビゲーションがもたらす可能性を痛感しています。

人工知能技術は、機械が周囲の世界に基づいて判断を下し、人間と同じように、あるいは人間よりも優れた方法で情報を処理できるという大きな可能性を秘めています。しかし、上記の例について考えてみると、AI の可能性は、多くの場合、電力、サイズ、コストの制約がない「大きなマシン」、つまりデバイスでのみ実現できることがわかります。言い換えれば、熱くなり、電源が必要で、かさばり、高価です。たとえば、世界有数の IT 大手である Alexa や Netflix は、ユーザーの意図を推測するために、クラウド内の大規模で電力を大量に消費するサーバー (データセンター) に依存しています。

自動運転車はおそらくバッテリーに依存することになるが、そのバッテリーが車輪を回して操縦する必要があることを考えると、そのエネルギー容量は莫大なものとなる。これらは、最もコストのかかる AI の決定と比較すると、膨大なエネルギー消費となります。

つまり、人工知能の可能性にもかかわらず、「小さな機械」は取り残されつつあるのです。小型のバッテリーで駆動するデバイスや、コストやサイズの制約があるデバイスでは、機械が見たり聞いたりできるという考えには対応できません。現在、これらの小さなマシンは、キーワードを聞き取ったり、光電式容積脈波記録法 (PPG) などの心拍数からの低次元信号を分析したりする、単純な AI 技術しか利用できません。

もし小さな機械が見たり聞いたりできたらどうなるでしょうか?

しかし、小さな機械が見たり聞いたりできることに価値があるのでしょうか?自動運転や自然言語処理などの技術を活用したドアベルカメラのような小型デバイスを想像するのは、多くの人にとって難しいかもしれません。それでも、単語認識、音声認識、画像分析など、それほど複雑ではなく、処理負荷も少ない AI 計算の機会は存在します。

  • ドアベルカメラや一般向けセキュリティカメラは、風による植物の動き、雲による光の急激な変化、さらにはレンズの前を動く犬や猫など、興味のないイベントによって作動することがよくあります。これにより、誤報が発せられ、住宅所有者が重要なイベントを無視するようになる可能性があります。なぜなら、住宅所有者が世界のさまざまな場所に旅行したり、眠ったりしている間に、セキュリティカメラが日の出、雲、日没による照明の変化を頻繁に警告するからです。よりスマートなカメラは、人体の輪郭などの物体の変化をより正確に識別し、誤報を回避できます。
  • ドアロックやその他のアクセスポイントでは、顔認識や音声認識を使用してアクセス権を確認できるため、多くの場合、キーや IC カードは不要になります。
  • 多くのカメラは、特定のイベントでトリガーされる必要があります。たとえば、追跡カメラは、特定の動物がフレーム内に現れたときにトリガーされる必要があり、セキュリティ カメラは、人がフレーム内に現れたとき、またはドアが開く音や足音などのノイズがあったときにトリガーされる必要があり、一部のカメラは音声コマンドなどでトリガーされる必要があります。
  • 大規模な語彙のコマンドは、多くのアプリケーションで役立ちます。 「Hey Alexa」、「Hey Siri」といったソリューションは数多く存在しますが、20 語以上の語彙で考えてみると、産業機器、ホームオートメーション、調理器具、その他多くのデバイスで人間とコンピューターのやり取りを簡素化する用途を見つけることができます。

これらの例はほんの表面をなぞっただけです。小型の機械で、これまでは人間の介入が必要だった問題を見たり聞いたりして解決できるようにするというアイデアは強力であり、私たちは毎日、創造的な新しい使用例を見つけ続けています。

小型機械に視覚と聴覚を与えることの課題は何でしょうか?

では、AI が小型マシンにとってそれほど価値があるのであれば、なぜまだ広く導入されていないのでしょうか?答えは計算能力です。人工知能の推論は、ニューラル ネットワーク モデルの計算の結果です。ニューラル ネットワーク モデルは、脳が画像や音声を処理する方法の大まかな近似値として考えることができます。脳は画像や音声を非常に小さな断片に分解し、それらの小さな断片が組み合わさったときにパターンを認識します。

現代の視覚問題に対する主力モデルは、畳み込みニューラル ネットワーク (CNN) です。これらのモデルは画像分析に優れており、音声分析にも非常に役立ちます。問題は、そのようなモデルでは数百万または数十億の数学的計算が必要になることです。従来、これらのアプリケーションの実装は困難でした。

  • 安価で低電力のマイクロコントローラ ソリューションを使用します。平均消費電力は低いかもしれませんが、CNN の計算には数秒かかることがあります。つまり、AI 推論はリアルタイムではなく、大量のバッテリー電力を消費することになります。
  • 必要なレイテンシ内でこれらの数学演算を実行できる高価で高性能なプロセッサを購入します。これらのプロセッサは通常大きく、ヒートシンクや同様の冷却コンポーネントを含む多数の外部コンポーネントを必要とします。ただし、AI 推論は非常に高速に実行されます。
  • 実装できません。低電力マイクロコントローラ ソリューションは遅すぎて役に立ちませんが、高性能プロセッサ アプローチではコスト、サイズ、電力の予算が超過してしまいます。

必要なのは、CNN 計算のエネルギー消費を最小限に抑えるためにゼロから構築された組み込み AI ソリューションです。 AI 推論は、従来のマイクロコントローラやプロセッサ ソリューションよりも桁違いに高速に実行され、電力、サイズ、コストを消費するメモリなどの外部コンポーネントを使用せずに実行される必要があります。

AI 推論ソリューションによってマシンビジョンのエネルギーペナルティを排除できれば、最小のデバイスでも周囲の世界で何が起こっているかを見て認識できるようになります。

幸いなことに、私たちはこの「小さな機械」革命の始まりにいるのです。 AI 推論のエネルギーコストを実質的に排除し、バッテリー駆動のマシンビジョンを可能にする製品が登場しました。たとえば、マイクロコントローラを使用すると、わずかマイクロジュールのエネルギーしか消費せずに AI 推論を実行できます。


<<:  データサイエンスについて知っておくべきこと: 10 の重要な概念 + 22 のグラフ

>>:  フロントエンドインテリジェンスは、AIがセキュリティに着地するための第2の足掛かりになりつつある

ブログ    

推薦する

スマートテクノロジーが戦いに加わり、宇宙探査が新たな機会をもたらす

今日、現代科学技術の出現と発展、そしてさまざまなインテリジェント技術の登場により、人類の宇宙旅行はよ...

「3D ガウス」バージョンですべてをセグメント化: ミリ秒単位で 3D セグメンテーション、1,000 倍高速

今年4月、Metaは「Segment Everything(SAM)」AIモデルをリリースしました。...

...

人工知能倫理ガバナンスは早急に実践段階へ移行する必要がある

今日の社会では、デジタル工業化と産業のデジタル化により、デジタル世界と物理世界の深い融合と発展が促進...

...

避けるべきビジネス インテリジェンス実装の悪い例トップ 10

ビジネス インテリジェンスは、あらゆる業界のグローバル企業の従来のワークロードを変革しています。ビジ...

弱電産業におけるAIの応用動向

近年、セキュリティ業界では、デジタル化された人工知能の学習および認識技術の概念がかなり普及しています...

FacebookはCNN Transformerの利点を組み合わせ、誘導バイアスを柔軟に利用するConViTを提案している

[[411034]] AI 研究者は、新しい機械学習モデルを構築し、パラダイムをトレーニングする際に...

...

ZTouch創設チーム:私たちの価値観を守り、新世代のグローバル企業のデジタルインテリジェンスパートナーになる

今日のデジタル時代では、顧客獲得の方法はよりシンプルになりましたが、さまざまなプラットフォームでの煩...

...

...

Raft アルゴリズムの原理と CMQ への応用 (パート 1)

[[202009]]導入Raft アルゴリズムは分散コンセンサス アルゴリズムです。 Paxos ...

Ma Yiチームの新作!大規模なマルチモーダルモデルを微調整すると、「壊滅的な忘却」につながり、パフォーマンスが大幅に低下する可能性があります。

モデルの壊滅的な忘却は現在重要なホットトピックとなっており、GPT-4 でもそれを回避することはでき...