数秒で理解:小売業における画像認識

数秒で理解:小売業における画像認識

【51CTO.comオリジナル記事】

スーパーマーケットに入ったところを想像してみてください。計量のための列も、QRコードをスキャンするための従来のレジも、携帯電話のQRコード決済もありません。あるのは5台のカメラを備えたレジだけです。あなたはどうしますか?実は、とても簡単です。商品をレジに置いて、カメラに「見て」もらい、カメラに向かって微笑むだけで、レジが完了します。YI Tunnelのスマート小売端末は、この新しい販売方法を私たちの日常生活にもたらしました。

旧来の小売業界では広く使われていない手動決済方法、バーコードスキャン、RFID技術と比較して、AIを活用したスマート小売技術は、顧客がより便利で迅速な計量、スキャン、チェックアウトのプロセスを体験できるようにし、ユーザーの好感度を高めます。では、旧来の技術を捨てた後、現在のスマート小売業界を支える新しい技術にはどのようなものがあるのでしょうか。

スマートリテールのための3つの主要な技術サポート

画像認識では、顔認識が顧客会員制度と連動しています。顧客が店舗に来ると、スーパーマーケットはより良いサービスを提供し、チェックアウト時に商品を自動的に識別することで、人々の時間を節約し、買い物をより便利にします。商品識別の発達により、ロボットは棚の整理、商品の仕分け、貨物の場所の移動も行えるようになり、人間に代わって単純で反復的な作業を行うことで生産効率が大幅に向上します。

音声認識に関しては、大手インターネット技術企業が人工知能スピーカー製品を発売しています。スマートスピーカーは、ディープラーニングを搭載したスマート執事に相当します。所有者の声や行動をクラウドに保存し、全員を識別して、いつどの商品を購入すべきかを思い出させてくれます。

デジタル人工知能アルゴリズムは、在庫管理、発注、製品選択、事業所選択に非常に役立ちます。ビッグデータ予測アルゴリズムは、近年のデータのほか、天候、休日、時間帯の影響も考慮します。機械は在庫や販売の注文を処理し、ユーザーの消費行動を研究することができ、将来の製品選択や価格設定に非常に役立ちます。

画像認識、音声認識、デジタル人工知能アルゴリズムは、機械認識の骨組みにすぎません。しかし、小売業をよりスマートにするには、より深い技術サポートが必要です。表面技術に基づいてより深い分析を行う方法は、スマート小売業界が解決しなければならない緊急の問題です。以下では、スマート小売業で最も広く使用されている技術である画像認識技術を簡単に分析します。

認識の核心 - 画像認識の分析

画像認識方法は、モデル方式と検索方式の 2 つのカテゴリに分けられます。モデルアプローチは、業界で最も研究され、使用されているアプローチです。モデルアプローチは、さまざまな機械学習手法を通じて、既知の「ラベル」を持ついくつかの画像を通じてこれらのラベルを記述する「モデル」を学習し、新しい未知の画像に対して、モデルが持つべきラベルを決定できるようにすることです。

検索ベースの方法は、ビッグデータ時代に登場した手法で、既知のラベルを持つ画像データを効率的に検索できるデータベースに構築することを基本としており、これを画像インデックスと呼びます。通常、インデックスを構築するには多数の画像が必要ですが、画像ラベルには少量のノイズが含まれることがあります。次に、テスト画像については、このデータベースにアクセスして、その画像と同一または類似する複数の画像を見つけ、これらの画像のラベルを組み合わせて、テスト画像のラベルを予測します。

もちろん、本質的にはこの 2 つの方法に違いはありません。唯一の違いは、検索方法が大規模な画像インデックスの技術を利用していることです。モデルを構築するのではなく、データを直接使用してマッチングを行います。したがって、この大規模なインデックスは特別なモデルと考えることができます。ビッグデータの時代では、認識と検索は切り離せないものになっています。正確な検索は認識と切り離せないものであり、広範な認識も検索と切り離せないものです。

モデル構築であれ、画像検索であれ、目標は機械がより正確に製品を識別できるようにすることです。小売業界における機械認識精度の最も直感的なフィードバックは、顧客の好感度です。そのため、すべてのテクノロジー企業は認識の精度を高めるために全力を尽くします。 YI Tunnelもその1つです。同社はAIを活用して小売業界を強化し、長い客待ち行列や面倒な従来のコードスキャン手順などの問題を解決する製品を設計しています。コンピューターグラフィックス、コンピュータービジョン、畳み込みニューラルネットワークなどの人工知能技術を使用して、便利なスマートリテールを実現します。それで、YI Tunnel はどのようにして AI の魂を段階的に機械に注入したのでしょうか?

世界初 YIトンネルAI無人レジ

機械学習を使用し、5台のカメラで24時間で500種類の商品を学習できます。YI Tunnel AIと呼ばれるこの無人レジは、学習効率を向上させるだけでなく、従来のスーパーマーケットの長い計量待ち行列の問題を解決します。商品をレジに置いてから識別するまで、わずか3.5秒しかかかりません。さらに、YI Tunnel AI無人レジにはFace ID技術が追加され、Face IDと会員IDが接続され、顧客が会員カードを持ち歩く手間がなくなりました。

RFIDや機械設備を不要にしたスマート自動販売機

世界初の商用 AI スマート自動販売機には SKU タイプの制限がなく、従来の機械および RFID 機器の 40% のコストしかかかりません。同時に、消費者の購買行動をリアルタイムで識別し、購入、販売、在庫をリアルタイムで管理できるため、セルフサービス自動販売機は真に AI インテリジェントになります。

RFIDやセンサーに代わる、純粋なビジュアル無人店舗「Super YI」

Super YI無人店舗には監視する専任スタッフはおらず、普通の棚とカメラがあるだけです。お客様は好きな商品をショッピングカートに入れるだけで、店を出る瞬間にパスワードなしで支払いを完了し、同時に請求書を受け取ることができます。 Super YI無人店舗は、複数人の同時ショッピングをサポートします。そのコア技術はAmazon Go無人店舗より3年進んでおり、棚の変更率を下げることで、コストはAmazon Goの5%~10%に抑えられます。

私たちの周りでは、スマート自動販売機や無人店舗が次々と更新され、アップグレードされています。AIによって魂を与えられた小売業界も徐々に成熟しています。基本的には複数の人や複数の商品を同時に認識できますが、商品の遮蔽や機械学習の速度にはまだ改善の余地があります。また、AIはもはや機械画像や音声認識の表面的な研究に限定されていません。保管スペースを削減しながら、よりスマートになり、効率を大幅に向上させる方法は、次のステップで深く研究すべきテーマです。

インタビューの最後に、呉一立氏は、2006年から2007年にかけてマイクロソフトでインターンシップをしていたときにマイクロソフトに対して深い愛着を抱くようになり、今回、第11回マイクロソフト アクセラレーター北京の卒業生企業になれたことを非常に嬉しく思っていると述べました。 YI Tunnel のサーバーは Microsoft Accelerator に参加した後、Microsoft Azure に移行されます。現在、YI Tunnel は、HNA の Kupu Daji 向けに、Microsoft Azure によって構築された認知サービス内の顔認識機能に基づいて、純粋な視覚技術で構築された世界初の無人店舗を構築しており、消費者は顔をスキャンすることで店舗に入る体験ができます。第二に、Microsoft Accelerator プラットフォームのおかげで、多くのトレーニングとガイダンスを受けることができ、管理能力やその他の面での能力が向上しました。さらに、Microsoft Accelerator は、YI Tunnel にブランドプロモーション、顧客とのつながり、資金調達とのつながりなどの面でのサポートも提供しています。現在、このアクセラレータは、YI Tunnel にコカコーラやマスターコングなどの企業との協力の機会を提供しています。ハーバードよりも合格率が低いこのプラットフォームに参加するのは賢明な選択です。

第 11 回 Microsoft Accelerator 北京に選ばれた企業の焦点は、人工知能の基盤となる技術プラットフォームを起業の方向性として、人工知能と産業用アプリケーションを組み合わせることです。これらの卒業生企業はすべて、ビッグデータ、人工知能、モノのインターネット、ブロックチェーンなどのテクノロジーを網羅するエンタープライズサービススタートアップであり、ヘルスケア、政府、小売、建設などの業界でベンチマーク顧客を獲得しています。

この記事は、51CTO と Microsoft Accelerator Beijing による YI Tunnel の特別レポートです。

<<:  はい、純粋なSQLクエリステートメントでニューラルネットワークを実装できます。

>>:  3Dマップナビゲーションに頼らず、自動運転技術が新たな分野に進出

推薦する

ブリッジで人間の世界チャンピオン8人が全員AIに負ける

最近、人工知能(AI)が再び人間に勝利しました。今回、人工知能はチェッカーやチェス、囲碁をプレイせず...

ウエストワールドがやってくる: ロボットは独自の言語を使ってコミュニケーションとコラボレーションを学ぶ

人工知能研究チームOpenAIが発表した最新の報告書は、ロボットが自ら作成した新しい言語を使って互い...

...

顔認識の歴史的な禁止が導入され、警察は犯罪者を捕まえるために顔認識を使用できなくなった

サンフランシスコは前例のない措置として、政府による顔認識技術の使用を禁止する規則を発布した。悪者を捕...

「激怒」するビッグモデルがレコメンデーションシステムと衝突したとき

ChatGPTに代表される大規模モデル技術の急速な発展により、レコメンデーションシステムは革命的な変...

...

...

...

数量を増やして価格を下げます! OpenAIが史上最強のChatGPTをリリース。誰でもGPTをカスタマイズ可能。GPTストアは今月開始予定

まもなく、すべての GPT コレクションが GPT ストアを通じてアクセスできるようになります。はい...

...

NeRFは過去のものになるのか?立体復元は3D GSの新時代へ! (復旦大学からの最新レビュー)

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

2030 年までに人工知能はどのようになるでしょうか?

[[378797]]画像ソース: unsplashマッキンゼー・グローバル・インスティテュートの調...

面接中にアルゴリズムの質問を解く際にプログラマーが知っておくべきこと

面接でアルゴリズムのみをテストする質問は、一般的に多くのプログラマーの友人から嫌われます。ここでは、...

IDC: 高速サーバー市場は2023年上半期に31億ドルに達し、GPUサーバーが依然として主流となる

10月9日、IDCコンサルティングの公式WeChatアカウントによると、IDCは本日「中国半期加速コ...

ディープインテリジェンスとは: 2021 年のディープインテリジェンスのトレンドは何ですか?

人工知能の開発は60年以上前に遡りますが、技術的な理由により、ディープラーニングの出現により再び人工...