数百万人の乗客を「迅速に配達」する人工知能の応用

ほとんどの人がテイクアウトを注文しており、今ではテイクアウトは中国人にとってもう一つの食事方法となっています。今日お話しするトピックは、「Ele.me」における人工知能の応用です。

[[212420]]

本日の内容は主に3つのパートに分かれています。

「Ele.me」の紹介。
「Ele.me」におけるAIの応用シナリオ。
オペレーションズ・リサーチと機械学習の応用例。

「Ele.me」について

ほとんどの人がテイクアウトを注文しており、今ではテイクアウトは中国人にとってもう一つの食事方法となっている。テイクアウト注文の規模は衝撃的です。

中国で最大の分野は、タオバオやJD.comなどの電子商取引で、次に滴滴出行やUBERなどの旅行業界、そしてシェア自転車です。これらの企業を合わせると、1日あたり約2,000万から3,000万件の注文があります。

フードデリバリー業界に関しては、現在までに1日あたりの注文数が2,500万件に達しており、この業界が急速に発展していることがわかります。

なぜデータとアルゴリズムがそれほど大きな役割を果たすのでしょうか? 「インターネット+」の文脈では、注文量が非常に多いことは誰もが知っているので、少なくともデータ業界ではやるべきことが山ほどあります。

2500万件の注文数を誇る「Ele.me」のシナリオとは？携帯電話のアプリを開くと、お気に入りのレストランを見つけることができます。誰もがレストランを選び、好きな食べ物を選びます。この行動は料理を注文することですが、実際には、Taobaoで服を購入したり、Ctripで航空券を購入したりするのと同じです。

これまでは電子商取引プラットフォームで取引される食品でしたが、今では食品だけでなく、花や医薬品も購入できるようになりました。現地での買い付けや配達サービスなども行われています。では、電子商取引は最初の部分にすぎません。電子商取引の規模はどのくらいですか?

「Ele.me」には、2億6000万人のCエンドユーザーが登録しており、Bエンドの加盟店は130万人で、毎年数千万件の注文があります。これは、電子商取引プラットフォームに基づく食品配達業界の一部です。

2 番目の部分は、上の写真で見られるように、ライダーが歩いているか電動自転車に乗って箱を運んでいるところです。これがローカル物流プラットフォームです。

なぜ私たちはローカルを重視するのでしょうか? それは、私たちの業界の特殊性が他の物流業界とは異なるからです。到着までには数日かかりますが、私たちの業界では、現地物流では30分以内にユーザーに商品を届けることを目指しています。

そのため、このアーキテクチャを設計する際には大きな課題に直面しました。これは少し異なりますが、アルゴリズムモデルについて話すときに明らかになります。私たちはローカルロジスティクスを行っているため、非常に厳しい時間的制約があります。

現在、当社には 300 万人の配達員がいます。毎日、平均して、全国で 30 万人から 40 万人の配達員がオフラインで活動しており、いつでも注文を受け付ける準備ができています。これはDidiと同じ運営モデルであり、現在では全国2,000以上の都市をカバーしています。

「Ele.me」におけるAIの応用シナリオ

フードデリバリー業界に人工知能が必要なのはなぜですか?地域生活の基盤として、食料、衣服、住居、交通手段が非常に必要であることは誰もが知っています。

各方向には多くの大手商人が存在し、彼らの技術的課題の違いはビジネスモデルによって異なるはずです。

1つ目はTaobaoです。これは、人々がオンラインで商品を購入する際に最もよく使用されるプラットフォームです。主にユーザーと販売者で構成されています。オフライン配送は市内であれば当日配送で、オープンプラットフォーム上でより多くの注文が行われます。

注文後、商品が配達されます。これが 3 つのリンクと 1 つの配達です。菜鳥や順豊エクスプレスもオープンプラットフォームであり、最も重要な点はタイムリーさです。通常、これは日数で計算されます。タオバオの場合のように、いわゆる残業手当はありません。

Ctripを見てみましょう。ホステルやホテルを予約できます。オンラインビジネスは主にユーザーと販売者で構成されており、オフラインの注文はありません。

フードデリバリー業界に特に近い企業はDidiです。ビジネスモデルの観点から見ると、旅行とフードデリバリーは非常に似ています。

Didi はオフラインとオンラインの両方でユーザーとドライバーのコミュニティであり、注文フォームもクラウドソーシングです。輸送能力はフランチャイズを通じて、またはオンラインで登録したドライバーを通じて引き受けられ、ドライバーは残業で罰せられることはありません。

自動車事故は起こるかどうかは誰にも予測できないため、時間制限も保証できないため、Ele.me と非常に似ています。

最後に、「Ele.me」とフードデリバリー業界について触れました。まず、オンライン部分は主にユーザーと商人で構成されており、オフラインの注文の方が多くなっています。ブルーライダーの中には「Ele.me」の従業員、つまり自営の人もいますが、チームやフランチャイズもあります。もちろん、クラウドソーシングもあります。

たとえば、今日は会議があり、午後にまだ 4 時間ある場合は、いくつかの注文を配達できます。これはクラウドソーシングの一形態です。

適時性は分単位で計算されます。当社は長年の目標を達成しており、全国平均で 30 分以内にお客様に注文をお届けできます。

残業手当もあります。30分を過ぎても10分以上配達されない場合は、補償として赤い封筒が渡されます。残業手当のプレッシャーは比較的高いですが、顧客にとっては、これは不十分なサービスに対する一種の補償です。

上記を踏まえて、私たちは大きな枠組みに入りました。つまり、フードデリバリー業界には3つの大きな枠組みがあり、1つは機械学習、1つはビッグデータであり、業務の最適化も機械学習と切り離せないものです。

業務の最適化に関しては、ビッグデータが業務の最適化の基盤として非常に重要な役割を果たします。この図が非常に興味深いものであることがおわかりいただけると思います。ビジネスにおけるアルゴリズムの問題について、あと 2 分ほどお話しします。大まかに 3 つのレベルがあります。

草の根レベルの食品配達業界は、30分以内にユーザーに食べ物を届けることを望んでいます。20キロや30キロ離れた場所に食べ物を届けるのは不可能です。飛行機が飛ばない限り、30分で10キロを配達するのは不可能です。

このような状況を踏まえて、すべての業界はAPPが開かれている現在の場所を基準にしており、測位範囲は半径3キロメートルまたは5キロメートルです。LBSは、オペレーターネットワーク上でさまざまな推奨や検索が行われることを保証します。次の2つのレイヤーは機械学習と最適化です。これら3つの部分について詳しく説明します。

貿易

下の図に示すように、中間のモジュールはユーザーと販売者の階層化、推奨検索、スマート補助金であることがわかります。これらの主要な方向性は、どの電子商取引会社でも実行する必要があるものです。

非常に洗練されたユーザーポートレートシステムに基づいて、ユーザーと加盟店のライフサイクルを厳密に管理し、これに基づいて対応する推奨、検索、補助金を提供したいと考えています。

たとえば、ユーザーが休眠期間に入った場合、特定の方法で顧客を刺激します。

オフライン

取引が発生すると、30 分以内にテイクアウト商品をユーザーに届けたいと考えています。これには機械学習による計画が必要です。インテリジェントなスケジューリング、食事の準備時間と配達時間の見積もり、ダイナミックプライシングなどのモジュールについて詳しく説明します。

インテリジェントなスケジュール設定はスケジュール設定の一部です。当社の 30 分には、準備時間、移動時間、さらには階下に商品を配達してエレベーターが到着するまでの待ち時間も含まれています。ですから、この 30 分間には予測できないことがたくさんあります。

では、圧力バランスとはどういう意味でしょうか?ご存知のとおり、オンライン取引は当社の物流とは相反するものです。オンライン取引では、できるだけ多くの注文をいただきたいと考えています。数秒以内に数千万人のユーザーが同時に注文してくれることを期待しています。

しかし、一度に30分以内にすべての注文を配送することはできません。圧力バランスを実現するために、取引、物流、流通のバランスを確保し、ユーザーの熱意を失うことなく取引品質を実現する必要があります。

下層

トランザクションとオフラインについてお話ししましたが、その根底にあるものがいくつかあります。それでは上の図をご覧ください。左側にはサイトの推奨などが含まれています。

先ほど、配達は地元で行うと述べました。販売業者が配達先を決めると、円を描きます。たとえば、円や六角形を描きます。これはランダムに描かれるわけではありません。

まず、この場所は高速道路や高架道路である可能性があります。すべてのプラットフォームが同じではありません。一部のユーザーは常に安い注文を出す可能性があります。グリッドとサイトを計画する際には、すべての要素を考慮します。

これには多くの運用最適化の問題が関係します。最後の例では、サイトの選択とグリッド計画の問題について説明します。

私たちのビジネスにとって非常に重要な人工知能に関する私たちの取り組みについて簡単にお話ししたいと思います。

オペレーションズリサーチと機械学習の応用例

この部分を 2 つの部分に分けます。

機械学習のアプリケーション例。
ソーシャル最適化のための機械学習のケーススタディ。

ケース1: 推定提供時間

まず、食事の配達時間の見積もりです。Didi を例に、待ち時間の見積もりについて説明します。

例えば、Didiで注文して浦東空港に行きたいと言った場合、車は2キロ先にあり、3分で到着すると表示されます。この3分は推定待ち時間です。

「Ele.me」は注文をすることと同じで、準備に約20分かかります。私たちが望んでいるのは、早く到着するよりも、ちょうどいい時間に到着する方が良いということです。

当社のプラットフォームに乗車する乗客は、ちょうど 20 分で到着します。早く到着した場合は、そこで待つのは乗客にとって無駄ですが、遅れた場合は、注文が時間制限を超えてしまう可能性があります。

食品の配達時間の正確さが重要です。注文が完了したら、完了するまでにどのくらいの時間がかかるかをどのように把握しますか?

このレストランは、レストランでの食事の準備時間、食堂で食事をする利用者の数、食べ物の種類、調理方法、注文の大きさなど、多くの要因の影響を受けており、食事が準備された後の通知はありません。

たとえば、レストランにたくさんのお客さんが来た場合、通常の状況では料理を作るのに 5 分かかるかもしれませんが、人が多すぎると 5 分では作れないかもしれません。

また、商品カテゴリーの問題や、当日の天候、レストランの集客状況、シェフの休暇による急な人手不足など、さまざまな要因により、見積りが不正確になることがあります。

私たちは、準備ができたらレストランに知らせてもらい、それを取りに行けばいいのではないかと考えました。そしてその理論はうまくいきました。

しかし、レストランのキッチンがどのような様子か想像してみてください。油まみれの手で注文を取りに来たシェフが、次の注文を見ているところを想像してみてください。これは想像しにくいことですし、この点に関するデータもありません。

これが前提です。私たちの解決策は間違いなく機械学習であり、最も単純なバージョンは線形モデルです。

最初は効果があまり良くなかったのですが、その後のGBDTに徐々に進化し、シナリオの中では平均的ながらも特別な平均には達しませんでした。また、食事の提供時間は10分なので、比較的正解率の高い7～13分に固定することができます。

平均を強調するのは、特殊なシナリオがたくさんあるからです。シェフに何かが起こった場合、機械学習は過去の出来事に基づいて未来を予測することしかできないため、私たちにはわかりません。

緊急時のための製品ソリューションもいくつかあります。たとえば、レストランの料理の配達量と注文量が直線的に増加しておらず、前方に混雑が予想される場合は、データに基づいてプラットフォームをリアルタイムで調整します。

最後に、私たちの方法は LSTM を使用したディープラーニングです。時間の相関関係によって予測の精度が向上します。食品の配達時間は過去の注文と関連していることは間違いありません。これは説明の必要がありません。

しかし、なぜそれが将来に重要なのでしょうか? 今後 3 ～ 5 分以内に新しい注文があると予測されますが、それらは既存の注文と共通点があります。同じ料理かもしれませんし、共通の場所があるかもしれません。同じ料理はキッチンへの注文であり、料理は一緒に調理することができます。

このモデルはこれらの特徴も捉えることができ、注文の割り当てや注文のパッケージングにも役立つことがわかりました。

ケース2: 移動時間の推定

推定移動時間は、注文が完了し、配達員が注文品を手に取り、オフィスまたは自宅まで走って行く時間です。これが推定移動時間です。

例えば、DidiがA地点からB地点まで連れて行く場合、移動手段は間違いなく車であり、Amap、Google Maps、Baidu Mapsなどの大量の地図データがリアルタイムでサーバーにアップロードされます。

この場合、交通状況の予測は比較的正確ですが、「Ele.me」のシナリオと比較すると、情報がはるかに少なくなります。

まず、乗客は歩いたり、エレベーターに乗ったり、階段を上り下りしたり、電動自転車に乗ったり、乗り換えたりする可能性があります。これが直接的に、データ収集の精度を著しく低下させます。また、建物内の交通は複雑で、このデータを取得するのが難しいという点もあります。

私たちが仕事をしているとき、レストランと顧客はすべて建物の中にいます。建物内には GPS 信号がないか、信号があまり良くありません。受信するデータまたは測位誤差は数百メートルにもなります。

したがって、Amap や Tencent Baidu Map の時間推定は履歴データに基づいているため、事前に時間を推定するには、軌道を確立する必要があります。

最初のステップは、履歴データをクリーンアップすることでした。屋内測位は不正確であったり、完全に欠落していたりしました。この場合、さまざまな方法を考えました。WiFi 信号、GPS 信号、または相互測位を使用して、測位の欠落の問題を最小限に抑えました。

第二に、位置特定ができたとしても、その位置には GPS トラックがあり、ノイズが多いため、ノイズ除去が必要になります。位置決めアルゴリズムを使用して、関連する時間、ポイント O、ポイント D を組み合わせ、最後に軌跡のクラスタリングを実行します。

ケース3: インテリジェントな注文分割

Didi と当社では注文を分割する難しさが異なります。Didi のシナリオでは、1 人のドライバーに割り当てられる注文は最大で 2 つまたは 3 つになります。

Ele.me では、1 人の配達員が 1 つのバッグに同時に 5 ～ 10 件の注文を詰め込みますが、注文間に時間制限があり、多くの時間厳守要件が課せられます。

2 つの解決策についてお話しします。1 つ目は、非常に伝統的な VIP であるパスプランニングの問題です。

注文を受けたら、乗客の定員と費用を固定して、一致するルートを探す必要があります。時間制限を超えないように、注文ごとに約束された時間は異なります。

デフォルトモードでは、配達員は一度に 5 ～ 10 件の注文を配達できます。各注文には厳しい時間制限があり、ランチラッシュ時には注文数が爆発的に増加します。

ソリューション 1 は、車両の経路計画です。

入力: 注文、ライダー、容量、コスト。
出力: 注文と乗客および移動ルートのマッチング。
最適化の目標: 時間または運転距離を最小限に抑える。
制約: ライダーが運ぶ注文数、ライダーの数、最遅到着時間など。

シミュレーテッドアニーリングアルゴリズムを使用しました。シミュレーテッドアニーリングアルゴリズム (SA) は、モンテカルロ反復解法戦略に基づくランダム最適化アルゴリズムです。

検索プロセスに、最終的にゼロに向かう時間変動確率ジャンプを与えることにより、シリアル構造の最適化アルゴリズムは、局所的最小値に陥ることを効果的に回避し、最終的にグローバル最適値に向かうことができます。

理論的には、このアルゴリズムは確率的なグローバル最適化性能を持ち、エンジニアリングで広く使用されています。VLSI、生産スケジューリング、制御エンジニアリング、機械学習、ニューラルネットワーク、信号処理などの分野で注文を割り当てるために使用されます。

しかし、最終的な結果は特に良くありません。時間の見積もりに不備があるからです。ルートを計画するときに、A と B のどちらを先にするか決めるときに時間に誤差があると、ルート計画が非常に悪くなります。

最後に、多数の関数に基づく組み合わせアルゴリズムでもある 2 番目のアルゴリズムが使用されました。

左下隅にマトリックスがあります。各行は注文、各列はライダーです。いくつかのルールと機械学習アルゴリズムを使用して計算したいと考えています。右側は注文のマッチングの結果です。

最適なマッチングは KM アルゴリズムであり、スケジューリングアルゴリズムの最も初期の進化は VRP です。

その後、KM アルゴリズムが採用されましたが、基本的なフレームワークが定義された後も、やるべき作業はまだたくさん残っていました。

注文はパッケージ化できるため、実際には注文は類似しています。数分待つだけで、この注文はあの注文と非常に類似している可能性があります。同じ場所に行き、同じ人に注文を渡すだけです。

そのため、注文の梱包と吸水が最初に行われますが、ピーク時とオフピーク時には注文のルールが異なります。道路には2つの方向があり、2つの方向の間には異なる角度があるため、注文マッチングモデルはバージョン2.2に基づいて開発されています。

私たちは機械学習を使用して履歴データでトレーニングしていますが、ここでもいくつかの課題に直面しています。異なるステーションの配達スタッフは習慣が異なるため、プロモーション時に問題が発生します。誰もがステーション A では問題ないと考えていますが、ステーション B ではそうではありません。

現在、数千のサイトにさまざまなサービスを提供できるようになりました。類似サイトの履歴に基づいていくつかの状況を共有します。これらのモデルを使用してトレーニングすることで、類似サイトが同様の注文分割方法を持つようになります。

したがって、この注文分割方法は特に嫌いではないでしょう。これらにはいくつかの類似点があり、後でバージョン 2.3 を作成しました。

現在のバージョンは学習が強化されており、リアルタイムの状況に応じて動的な調整を行います。

レストランの立地選定については、ここでは詳しくは触れません。私たちは、企業と協力してレストランをオープンする取り組みも始めています。私たちは、レストランが最も多くのユーザーをカバーできる最適な場所を選びたいと考えています。料理もユーザー層もそれぞれ異なるため、立地選定は非常に重要です。

要約する

私は10年以上機械学習に取り組んでいます。個人的には、私の仕事の課題は、基本データの完全性と正確性から生じていると感じています。

先ほど申し上げたように、データが不正確であったり、レストランが不規則であったりと、正確な状況が把握できないこともあり、基礎データの調整に多くの時間を費やしました。

2 点目に述べたのは、フードデリバリー業界では人がタスクを実行する必要があるため、アルゴリズムの改善と人間の行動の理解がより重要になるということです。以前は、手動での割り当ては電話で行われ、多くのコミュニケーションが必要でした。

機械が一度に負担を分担するようになったため、機械にとって理解が難しくなっています。さらに、機械は局所最適ではなく全体最適を考慮しますが、これは人間にはできないことです。

アルゴリズムの改善と製品の運用を組み合わせることによってのみ、この問題を前進させ、全員に習慣を身につけさせることができます。

3 つ目のポイントは、最適化アルゴリズムと機械学習が私たちの業界では相互に補完し合っていることです。機械学習だけでなく、より重要なのは、いかに短期間で人材を最適に配分し、最短時間で注文を完了できるかということです。

[[212422]]

Ele.meの技術担当副社長である張昊は、以前は滴滴研究所のシニアディレクター、Uberビッグデータ部門とLinkedIn検索分析部門のシニアデータサイエンティスト、Microsoft音声認識グループのシニアデータエンジニアを務めていました。現在はEle.meで人工知能とビッグデータの構築を担当し、チームを率いて機械学習を物流スケジュール、圧力バランス、推奨検索などのシナリオに適用しています。データマイニングを通じて完全なデータ運用システムを確立し、運用効率を向上させ、データとインテリジェンスでビジネス開発を推進しました。機械学習、データマイニング、分散コンピューティングの分野で10年以上の実務経験があります。

<<: 2017 年グローバル人工知能人材ホワイトペーパー: 世界トップクラスの AI 人材の秘密を解明!

>>: セキュリティにおける AI の必要性: 機械学習から機械の作成まで