多くの学生は、フードデリバリーはオンラインで注文し、オフラインで配達するビジネスであり、ビジネスモデルは単純であると考えています。この考えは正しいですが、理解は一方的です。それを解決するには、テクノロジーだけでなく、ディープラーニングも必要です。では、なぜフードデリバリーにはテクノロジーが必要なのでしょうか? なぜディープラーニングテクノロジーが必要なのでしょうか? フードデリバリーにおけるディープラーニングの価値。フードデリバリービジネスのシナリオと特徴を簡単に理解すれば、技術的な手段で解決する必要がある困難さが理解できるでしょう。 ビジネスシナリオの観点から見ると、グループ購入、レビュー、予約、テイクアウトに分けられます。 共同購入には、過去のMeituanとDianpingのように、もちろんこの2社は現在も協力しており、以前はWoWo、Lashou、Baidu Nuomiもありました。 テイクアウトなら、Meituan WaimaiやEle.meなど。 Dianping は、従来の Dianping と同様に、情報プラットフォームの形でユーザーに情報と意思決定を提供します。 予約など、美団は食べ物の注文に関連する多くの事業を行っています。 実際、食品配達の O2O オフライン シナリオとビジネス モデルは、上の図に示されているものよりもはるかに複雑です。 フードデリバリー業界全体が急速に発展しています。当社の注文数は2014年に100万件を超えたばかりでしたが、今年6月には1,200万件を超えました。 グループ購入や電子商取引プラットフォームと比較すると、テイクアウトビジネスには、電子商取引、運用化、ローカリゼーション、シナリオベースという 4 つのビジネス特性があります。 まず、電子商取引についてお話ししましょう。テイクアウトの取引はクローズドループにすることができます。これは Taobao や JD.com の電子商取引モデルに似ていますが、オンラインとオフラインの組み合わせであるという点が異なります。ケータリングの有無にかかわらず、サービスを提供する店舗はすべて実店舗です。 次に、運用化の特徴です。1つは、マーチャント、ケータリング、非ケータリングなど、コンテンツ形式の多様化です。ケータリングには多くのパッケージの組み合わせがあり、商品形式はコンテンツ形式に見られますが、現時点では明らかではありません。 もう一つは、運営能力で、加盟店の自主運営能力、BDの自主運営能力、ライダーの運営能力などがあり、これらは全く同じではありません。 もう一つの特徴はローカリゼーションです。ユーザーにとっては、一般的に緑色のエリア内の加盟店が提供するサービスしか利用できないため、需要と供給の関係が制約されていることがわかります。 もう一つの領域は、需要と供給の動的な変化です。動的な変化 まず、商店は24時間営業しているわけではなく、次に、商店の配達距離も動的に変化します。 技術的な観点から見ると、サービス全体の動的な変化に対応するにはパーソナライズされたデータが必要であり、これは大きな課題です。 ***1つはシナリオベースです。上の図は、1日24時間のテイクアウト注文の分布曲線です。ピークは2つあり、1つはランチのピーク、もう1つはディナーのピークです。これは時間の期間区分です。基本的な食事のシナリオでは、ユーザーの地域や地方の食習慣に大きな違いがあります。 これらのビジネスの特徴を考えると、一つはパーソナライゼーションの度合いが高いこと、そしてもう一つは改良への要求が大きいことです。 時間シナリオ、地理的シナリオ、さらにはより詳細なビジネスシナリオの洗練度を深める必要があります。もう1つの側面は多様性の特性であり、多様な形式、多様な内容、多様な供給単位を含みます。リアルタイムの程度も非常に重要です。配送距離はリアルタイムで変化するため、リアルタイムの監視を行う必要があります。 これらのビジネスの特性を考慮すると、これらの技術的課題を解決するために必要な基本的なツールは何でしょうか? 以下は、Meituan Dianping のビッグデータ プラットフォーム全体の簡単な紹介です。 美団点評のビッグデータプラットフォームアーキテクチャ 美団点評のビッグデータプラットフォームのアーキテクチャ。最上層は美団のインフラストラクチャです。美団は独自のクラウドプラットフォームを持っているため、すべてのサーバーはクラウドプラットフォーム上にあります。 クラウド プラットフォームの上には、HDFS などの基本サービスと、Hbase などの関連インフラストラクチャがあります。上位層は機械学習プラットフォームであり、それに応じて非線形数値ツールが導入されます。 上位には、ホテルや観光事業、エンターテインメントなどの総合事業、そして同社の広告プラットフォーム全体を含む、美団点評のいくつかの大規模な事業グループがあります。 メインアーキテクチャの上にはLogプラットフォームがあります。ビジネスが多数あるため、BエンドでもCエンドでも、ビジネスによって生成された大量のデータはLogプラットフォームに均一に保存され、Logプラットフォームによってトップレベルのビジネスプラットフォームに接続されます。 もう 1 つは、サービス監視、データ監視、ビジネス スケジューリングを含む監視プラットフォームです。 美団点評のディープラーニング応用実践 次に、美団点評におけるディープラーニングの2つの主要な応用シナリオを簡単に紹介します。 応用シナリオ1:画像技術 Meituan プラットフォーム上の技術コンテンツは、画像やテキストなど多岐にわたります。特に、ユーザーが携帯電話で多くの決定を下す場合、画像は決定に決定的な影響を及ぼします。 画像の分野では、2つの重要なことを行いました。1つは画像品質技術、もう1つはOCR技術です。 画質技術の応用シーンは何ですか? 上の写真に示すように、左側の写真は明らかに見やすく、右側の写真は乱雑に見えます。 これは主観的に説明するのが難しく、人の直感的な感覚にすぎません。 具体的には、左側の 2 つの画像の方が鮮明で、より完全である可能性があります。ユーザーが決定を下す際に、プラットフォーム上でより高品質の写真を提供すれば、ユーザーはより早くクリックするようになります。 販売者にとっては、ユーザーのニーズが販売者のものと一致すると簡単にコンバージョンできます。しかし、右の写真に関しては、体験全体を変換する能力は比較的弱いです。 このような背景を踏まえて、画質を評価し、いくつかの重要な難しさや課題を発見しました。重要なポイントは 3 つあります。 画像内の鮮明さ、完全性、構成を定義するなど、基準を判断するのは困難です。業界全体で画質の標準的な定義はありません。 ユーザーの重視する点はそれぞれ異なります。画像が鮮明かどうかを気にするユーザーもいれば、画像が完全かどうか、重要な情報が切り取られていないかどうかを気にするユーザーもいます。 手作業によるラベル付けはコストがかかります。 これらの問題をどのように解決するのでしょうか?私たちは、美的コースのようなモデリング方法と、画像ベースの機能のようなモデリング方法を導入し、サンプルの注釈付けには自動注釈付け方法を採用しました。 写真のソースを見ると、ユーザーによって自動的にアップロードされた写真、つまりUGC写真は比較的品質が悪いことが直感的にわかります。弊社の専門スタッフが開いた画像はより高品質になり、基本的な注釈を付けることもできます。 もう 1 つの部分は、ユーザーの行動に基づいています。より頻繁にクリックされる写真、つまりユーザーが興味を持っている写真や品質の良い写真がユーザーに示されます。クリック頻度が低い写真については、品質が低いと考えられるため、サンプルを自動的にマークできます。 画像入力については、各画像が高品質か中品質か低品質かを直接識別するのではなく、ファーストフード、洋食、簡単な食事などのカテゴリーを含め、DNNを通じて画像の美的品質を判断するなどの学習アプローチを採用しています。 他の部分は、画像のコントラストを含む画像の色などの基本的な特徴です。 これらの基本的な機能は、モデリング全体にも使用できます。もう 1 つの部分は、全体的なディープ ラーニングです。私たちはこれを直接行いました。KOS 法を使用して、どの画像品質が優れているか、どの画像品質が悪いかを判断します。最も重要なことは、大量の画像からより良い画像を選択してユーザーに表示することです。 関係するデータはより商業的なものです。全体的に、モデリングが完了した後、ユーザー エクスペリエンスが向上しました。 応用シナリオ2: OCR技術 前回は全体的な画質の技術について、次回はOCR技術についてお話します。 OCR はデータ検出に使用されます。Meituan Takeaway における OCR の主な用途は何ですか? 比較的大きな側面は自動審査です。ユーザーに信頼性の高い、または高品質のサービスを提供するために、販売者のライセンス、営業許可、製品の品質を審査する必要があります。これを手動で行うと、人件費が非常に高くなります。 もう 1 つの部分は、自動データ入力です。 マーチャントがフードデリバリー プラットフォームに参加した後、料理を入力する必要があります。 特に、マーチャントはメニューを常に変更して入力する必要があります。 この部分は自動データ入力プロセスです。 これらは、基本アプリケーションにおける 2 つの需要ポイントです。 画像を形成する方法は多様で、テキストは非常に複雑です。多くの画像のテキストは標準的な楷書体ではありません。さまざまな乱雑なフォントがあり、変形したフォントもあります。画像の背景は非常に複雑で、そのようなシーンを区別するのは困難です。これは、OCR全体に技術的な課題をもたらします。 これらの問題をどのように解決すればよいでしょうか? OCR 認識技術が重要な技術であることが分かりました。テキスト検出は画像から始まります。たとえば、画像内のテキストと画像自体を検出します。 もう一つの部分はテキスト認識です。画像を検出した後、その中のテキストをどのように認識するのでしょうか。この部分では、CNN メソッドを全体的に採用し、BLSTM モデルを追加して、シーケンス モデリング全体の能力を考慮します。最後の部分は、CTC シーケンス認識モデルです。 当社のプロセス全体が手動レビューから自動化プロセスへと移行し、全体的な運用効率が大幅に向上しました。 評価モデルにおける Meituan Dianping DNN の応用 次に、先ほど述べたように推定が多く含まれる点も含め、推定モデルにおけるDNNの応用について詳しく紹介します。広告に関わるCTR推定など、アルゴリズム分野全体で推定は非常に頻繁に使用されます。最適化の目標が CTR である場合、それは CTR の推定であり、ROI の推定は多数あります。 近年、国内外の大手インターネット企業は、DNN ベースのモデルと、従来のモデルのいくつかの欠点を改善する方法を研究しています。これは、私たちが行っている対応する調査の一部です。 まず、当社のビジネスモデルについて簡単にご紹介させていただきます。先ほど、事業の特性を紹介しました。事業の特性を踏まえた上で、ユーザーモデルはどのようなものになるでしょうか。重要なステップがいくつかあります。ユーザーが意思決定を行う際に関連情報を見たとき、それがユーザーのターゲット需要であるかどうかが、ユーザーの消費決定を決定します。 まずクリックすると、販売者の注文ページに入り、料理を追加または削除できます。その後、ユーザーは注文を送信できます。送信後、ユーザーは住所などの一連の入力を行い、支払いが行われ、ユーザーは販売者のシステムに入ります。 プロセス全体はファネルのようなものです。このファネルでは、各フィールドに対応するコンバージョンがあります。推定値を作成することも、リンク全体の完全な推定値を作成することもできます。 もう 1 つの部分は、このような推定モデルでは、複数の次元の特徴を通じてサンプルを記述し、特定の学習モデルを使用して最終的なプリセット結果を取得することです。 フードデリバリーのシナリオでは、機能の次元はより複雑です。前述のユーザー機能は最も基本的なものです。他の部分には、シーンレベルでの場所の機能、さまざまな建物の種類、さまざまなユーザーのニーズが含まれ、時間も食事のデリバリーの特性に関係します。ユーザーは間違いなく、より速い配達による結果を好むでしょう。 これはさまざまなビジネス シナリオに分かれています。たとえば、12 時にランチを注文した場合、10 分以内に配達してほしいと思うかもしれません。フルーツを食べたい場合、3 時間待つことができます。 機能の組み合わせとは何ですか? もう一つは、直営モデルを採用している加盟店の特性であり、最も重要なのは加盟店が提供する商品です。店舗の品質や全体的な転換能力など、各実店舗は、商品特性だけでなく、運営能力の面でも多くの特性を持っています。 この観点から見ると、特徴を定義するプロセス全体には多くの特徴があり、非常に多くの次元からさまざまなモードを切り出すことができます。特徴を定義し、特徴を組み合わせるコストは非常に高く、このプロセスは手動の経験に依存しています。業界全体では、パーソナライズされた推奨の方が効果的です。なぜそれが効果的でしょうか? 優れた技術を持っていることに加え、ビジネスにおいても多くの特徴を定義しています。技術自体に対する深い理解に加えて、ビジネスにおいても多くの特徴と経験があります。もう 1 つの問題は、特徴の選択です。特徴が多すぎると、特徴選択のコストが非常に高くなります。価値のある特徴をどのように選択すればよいでしょうか。 先ほど、DNN が優れている点についていくつか重要な点を述べました。なぜこれほど多くの DNN を試すのでしょうか? 一方で、従来のモデルは長年にわたって研究されてきましたが、他方では、従来のモデルにはいくつかの欠点があります。 その利点は、非常に高速で、基本的に線形モデルであることです。数千億の特徴を使用しますが、欠点は線形であるため、非線形機能が比較的弱いことです。ただし、実際のシナリオは単純な線形化ではなく、非線形化、またはさらに複雑な構成です。 一方、線形であるため、最も基本的なロジックは 1 次元であり、各人が手動で機能を組み合わせる必要があります。機能を組み合わせるには、手動の配置が必要です。3 つ用意する場合は 3 つで十分です。それ以上用意すると非常に複雑になるため、機能の組み合わせのコストが非常に高くなります。 ツリーモデルの応用 ツリーモデルは特徴の組み合わせの問題を解決できます。同時に、単純に線形に分割するのではなく、空間全体を多次元化することで、ツリー空間全体の問題を解決することもできます。そのため、その解決策は、線形機能の制限の問題です。 例えば、先ほど挙げた業態にはファーストフード、軽食、洋食などがあり、それ以外の部分はテキストの特徴で、ツリーモデルがあまり得意ではないため、これをベースに複数の DNN モデルを試しました。 システム全体のアーキテクチャは、2 つの主要なレベルに分かれています。1 つ目は基本データ層で、ユーザーが到着した後の APP 上のデータ、当社の API や多くのビジネス データが含まれます。これは 2 つの部分に分かれており、1 つはオフライン データ処理、もう 1 つはオンライン リアルタイム データ処理です。 オフライン データにはいくつかの重要なステップがあり、オンライン データの全体的なロジックは似ています。コア ロジック部分には、API への到達、API から後続のサービス、ユーザーがテクノロジを使用するか特定のラインを使用するかなどが含まれており、これはビジネス特性のルールに従って分類する必要があります。 フードデリバリーの主要機能のシステム全体を見てみましょう。1 つはユーザー ディメンション、もう 1 つはマーチャント ディメンションです。 ユーザーポートレートから、基本ユーザーが男の子か女の子か、学生かサラリーマンか、好みは何か、広東料理が好きか北京料理が好きか、購買力は高いか、食事に100元使うか20元使うか、割引の好みなど、さまざまな情報が得られます。 マーチャントレイヤーには、マーチャントの基本情報だけでなく、マーチャントとMeituan Dianpingが使用するサードパーティの配送方法も含まれています。そのため、配送の適時性には大きな違いがあります。これは独立した機能であり、さまざまな組み合わせ機能と関連機能もあります。 たとえば、ユーザーが閲覧、クリック、注文した回数やそれに応じたクリック率など、重複する機能が多数あります。 ポリシー システムに慣れた後、まずは 2 つの部分に分かれた Google の古典的なディープ モデルを試しました。特徴が入力されると、予測が行われ、対応する結果が得られました。 次に、Wide ブロックでは単一の機能または機能の組み合わせを出力できることを簡単に紹介します。機能はモデル空間に転送する必要があります。Deep ブロックでは、ビジネスの特性に応じてパラメータを試したり調整したりできます。 もう1つは、特徴を作るときに、高次元ではありますが、高次元を低次元空間に移すことができるという部分です。この部分はより詳細な図です。この図では、特徴を階層化しており、より柔軟にすることができます。異なるメーカーで使用したり、メーカーによっては、最終的なロジスティック回帰層に介入したりすることもできます。 モデル構築のプロセスでは、オフラインが鍵となります。オフライン部分の 1 つはサンプル処理で、サンプルのクリーニングやクローラーのフィルタリングが含まれます。現在、多くのクローラーが存在し、これらのクローラーのデータは全体的な効果に大きな影響を与えます。 さらに、無効な読み込み、素材の最適化、価格サンプルまたはサブサンプルの調整方法はすべて重要であり、ユーザーのクリックコンセプトを使用してそれを提供します。 業界で広く使われています。新規ユーザーでも割引を受けるためにクリックします。これは彼らの興味を表すコンテンツです。私たちはいくつかのスクリーニングを行い、比較的一定の頻度または製品を持つユーザーをサンプルスペース全体として選択し、正確にデータを収集しました。 上記のモデルは、さまざまな機能をさまざまなレベルに分割します。さまざまなモデルでさまざまなレベルの分割が使用され、機能の機能がより強力に使用されます。ただし、ご覧のとおり、前のモデルは特定の機能を使用しており、実際の順序機能は考慮されていません。 実際、ユーザーがシナリオに入ると、それが電子商取引製品であろうとテイクアウト製品であろうと、一連の行動を必ず行います。 たとえば、最終的な注文を出す前に、実際のシーケンスを構築し、実際のシーケンスを各期間の入力として使用する必要があります。同時に、各期間に対応する機能を備えたプロジェクトを実行し、最終的に完全な予測を行って対応する結果を取得する必要があります。 これは古典的な RNN を使用したモデルです。長シーケンス マシン モデルと短シーケンス マシン モデルを試すことができます。 この部分はユーザーのリアルタイム アーキテクチャに関係するため、当社のリアルタイム システムのアーキテクチャについて簡単に紹介します。基本的には、まずユーザーの個人行動データです。シーケンスを入力すると、それに応じて整理されます。 KV構造全体から、複数のレイヤーの指標を同時に監視し、データが正常かどうか、日々のデータに対してどのように対応する処理を行うことができるかを監視します。 次に、ユーザー情報について簡単に紹介します。1つは入力で、さまざまなアプリケーションシナリオに応じて選択されます。実際、クリックユーザーシナリオでは、ユーザーをクリックして表示できます。同時に、その各入力は対応するワンホット入力である必要があります。 出力はシーケンスにすることもでき、実際のシナリオに応じて制御できます。シーケンス内の確率に応じて選択すると、一定の確率のソートに従って対応するシーケンス結果がユーザーに提供され、ユーザーのニーズを正確に識別します。 ここで重要な点は、シーケンスの長さです。シーケンスの長さは、さまざまなビジネス方法に応じて調整されます。シーケンスが長すぎると、一方では疎になり、他方では計算時間が非常に長くなります。 シーケンスが短すぎると、ユーザーの情報が完全にマイニングされず、特定の時間枠に従って対応する選択を行う必要があります。最終的なメリットは、ユーザーへの推奨事項の精度が大幅に向上し、プラットフォーム全体のコンバージョン率と収益が増加したことです。 結論 テイクアウトでは、ビジネスが重要です。最終的な効果をどのように達成できるでしょうか?技術的な観点から理解するだけでなく、ビジネスをより深く理解する必要があります。ビジネスを理解した後、この問題を解決するためにどのテクノロジーを使用するかを決めることができます。 また、アルゴリズムの選択に関しても、アルゴリズム全体の中で優れた方法を見つけるには多くの試行錯誤が必要です。多くのモデルを試し、どのようなシナリオや問題に対してどのような戦略がより適切かをまとめる必要があります。 |
<<: ディープラーニングのトレーニング中に GPU の温度が高すぎますか?すぐにクールダウンするには、以下の数行のコマンドを入力してください
>>: AI開発者キャンプへの無料登録 - ハンズオン/デモンストレーションでAIに密着!
[[229220]]よく知られているように、SQL は、開発者が大量のデータに対して効率的な操作を...
[[286163]]質問: 空でない 2 つのリンク リストが与えられた場合、2 つの負でない整数...
機械学習への関心は過去 10 年間で爆発的に高まりました。ほぼ毎日、さまざまなコンピューターサイエン...
01.人間は日々、環境、社会、他の人々、物と密接に関わっています。このタイプの接続は、一方向、双方...
10年以上前、テヘラン大学の研究者らは、Surenaと呼ばれる原始的なヒューマノイドロボットを発表し...
今後数年間で、初めて医療用人工知能 (AI) システムとやり取りすることになるかもしれません。自動運...
[[267184]] [51CTO.com クイック翻訳] 近年の機械学習技術の急速な発展により、ネ...
2019年、「5G」は大いに期待されるテクノロジーの流行語となり、その人気は間違いなく人工知能に劣り...
人工知能は、生成的敵対的ネットワークを使用して、笑顔、悲しみ、怒り、驚きなどの個別の顔の属性を生成し...
今日、ビッグデータ アプリケーションがビジネスのあらゆる側面で急増しているため、IT チームは膨大な...
[[379153]] [51CTO.com クイック翻訳] 研究によると、人工知能技術はさまざまな業...
動機: ディープラーニングをより深く理解するために、Tensorflow などのディープラーニング ...