ホテルは機械学習を使ってどのゲストが立ち上がるかを予測する

ホテルは機械学習を使ってどのゲストが立ち上がるかを予測する

現在、主要なOTA(オンライン旅行代理店)プラットフォームは人々の旅行を大幅に容易にしています。ホテルの宿泊施設、アトラクションのチケットなどは、数回クリックするだけで簡単に予約できます。

国内外にはホテルやホームステイの予約プラットフォームが数多くある

より多くのユーザーを予約に誘致するために、これらのプラットフォームは、いつでも無料でキャンセルできる、または限られた時間内で無料でキャンセルできるなど、より緩やかなキャンセルポリシーを設定するよう販売者に奨励するでしょう。

客室販売数で世界最大のオンラインホテル予約サイトであるBooking.comは、無料キャンセルの利点から旅行者の間で人気があります。

しかし、「無料キャンセル」はユーザーにとっては非常に嬉しいのですが、ホテルにとっては頭痛の種です。注文を一時的にキャンセルすると、ホテルには通常次のような損失が発生します。

  1. キャンセルされた客室は時間内に販売できず、ホテルは収益を失います。
  2. ホテルはキャンセルされた客室を販売するために料金を値下げし、利益が減少
  3. これらの部屋をできるだけ早く予約するために、ホテルは宣伝と流通チャネルに追加のコストを負担する必要があります。

利用者がいつでもホテルを立ち退くことができる場合、ホテル側が損失を最小限に抑える方法はあるのでしょうか?

ポルトガルのビジネスアナリスト(BA、IT 企業のプロダクトマネージャーに相当する役職)であるマヌエル・バンザは、ホテル経営で 5 年以上の経験を持っています。彼は、ヨーロッパのホテル予約プラットフォームの公開データを活用して、注文をキャンセルする可能性が高いユーザーの特徴を発見し、ホテルがタイムリーに損失を食い止められるよう支援しました。

約12万件のホテル予約データからパターンを発見

データ サイエンスの愛好家である Manuel Banza は、データ サイエンスと機械学習からスタートしました。

彼はまず、「ホテル予約需要データセット」の包括的な分析を実施しました。このデータセットには、次のものを含む、一般的なホテルとリゾートホテルの 32 次元のデータが含まれています。

ユーザーの国籍、予約時間、滞在期間、大人と子供または幼児の数、注文が最終的にキャンセルされたかどうか、ユーザーがこの注文の前に注文をキャンセルした合計回数などの情報。

ホテル予約需要

ホテル予約需要データセット

発行機関: ポルトガル、リスボン大学

含まれる項目数: 32次元の119,390データ項目

データ形式: csv

データサイズ: 16.9 MB (圧縮ファイルの場合は 1.3 MB)

アドレス: https://hyper.ai/datasets/14866

部分的なデータ表示

マヌエル・バンザは統計を通じて、1年間で多数のユーザーがホテルの予約をキャンセルしたことを発見しました。

2018年、OTAプラットフォームBookingでの予約をキャンセルしたユーザーは49.8%に上り、HRSグループではその割合は66%にまで達しました。全体として、複数のプラットフォームの平均予約注文キャンセル率は、2018 年に 39.6% に達しました。

さまざまな予約チャネルでキャンセルされた注文の割合

次に、著者はデータの探索的分析を実施し、次のことを発見しました。

  • 一般のホテルやリゾートホテルに比べ、宿泊客による予約キャンセルの可能性が高くなります。
  • キャンセル率は春節と夏季に高くなり、冬季に最も低くなります。
  • さまざまな予約チャネルの中で、ユーザーは OTA プラットフォームで最も多くの注文を行っていますが、最も多くの注文が OTA プラットフォームでキャンセルされています。
  • ユーザーが予約を早く行うほど、不確実性が高まり、キャンセルの可能性が高くなります。

著者らは、ホテルの収益実績を分析する際に、予約時間は最も重要な指標の 1 つであると述べています。分析結果によると、1年以上先の予約の場合、キャンセル確率は57.14%と最も高く、1週間以内の予約の場合、キャンセル確率は7.73%と最も低いことがわかりました。

予約前の日数(横軸)はキャンセルの可能性(縦軸)に比例する

早めに計画を立てれば立てるほど、変化に対応できなくなる可能性が高くなるようです。

機械学習モデル: 誰が立ち上がる可能性が高いかを予測する

データセットを徹底的に分析した後、著者らは注文のキャンセルを予測するモデルの構築を開始しました。

ステップ1: データのクリーニング

まず、データセット内の欠損値を処理します。これらの欠損値は、変数が数値の場合は特徴量の平均に、変数がカテゴリの場合は定数に置き換える必要があります。

次に、機械学習モデルが予測する値であるreservation_status(注文がキャンセルされたかどうかを表す予約ステータス。キャンセルされていない場合は 0、キャンセルされた場合は 1)を削除します。

ステップ2: 最適なモデルを選択する

データに最適なアルゴリズムのテストを開始する前に、データセットを 8:2 の比率で分割します。その後、データの 80% はモデルのトレーニングに使用され、データの 20% は検証セットとして使用されます。

データ サイエンスの分野では、注文のキャンセルを予測することは、バイナリ分類とも呼ばれる教師あり分類問題です。そのため、著者はトレーニングと比較のために、LightGBM、CatBoost、XGBoost、H2O などの既存のバイナリ分類モデルをいくつか選択し、最終的に最良の実験結果が得られた CatBoost モデルを選択しました。

CatBoost の予測結果から、次の点がわかりました。

  1. ユーザーの国籍がポルトガル人の場合、キャンセルされる可能性が高くなります。ただし、団体予約の場合、ホテルは通常、各人の国籍情報を事前に取得しません。予約がキャンセルされた場合、ほとんどのホテルでは国籍はホテルの所在国にデフォルト設定されます。したがって、この情報は参考用であり、正確ではない可能性があります。
  2. 特別なリクエストを一切行わなかったユーザーは、少なくとも 1 つの特別なリクエストを行ったユーザーよりも注文をキャンセルする可能性が高かった。
  3. lead_time(予約時刻からチェックイン時刻までの日数)の値が低いほど、予約キャンセルの可能性が低くなります(この予測結果は、これまでのデータ分析結果と一致しています)。

[[390579]]

ポルトガルの人気ホテル「ユーロスターズ・ミュージアム」では考古学の展示が行われている

複数のOTAプラットフォームで開始し、オンライン予約と無料キャンセルをサポート

検証セットにおける CatBoost モデルのパフォーマンス:

「ホテル予約需要」データセット全体のパフォーマンス:

ホテル:キャンセルする前にお金を貯めましょう

この予測モデルを使用することで、ホテルはどのユーザーが注文をキャンセルする可能性が高いかを事前に把握し、タイムリーな是正措置を講じることができます。

たとえば、キャンセルする可能性が高いユーザーに事前に連絡し、コミュニケーションを通じてできるだけ早くキャンセルするよう促すことで、ホテルは客室を販売する時間を増やすことができます。

あるいは、キャンセルする傾向があるユーザーに連絡して、ホテルの利点を紹介し、滞在特典を提供して流れを変え、ユーザーを維持することもできます。

<<:  Facebook、動画から学習する新たなAIプロジェクトを開始

>>:  人工知能は若者を失業させるでしょうか? 996に圧倒されないでください。そうしないとチャンスがなくなります。

ブログ    

推薦する

...

チャットボットが消費者と企業に役立つ6つの方法

チャットボットは非常に一般的になったため、消費者はそれを当然のこととして受け止め、オンライン世界のあ...

小売環境におけるAIとIoTの長期的な応用

IoT カメラは、小売環境をより効率的かつ顧客に優しく、そして何よりもセキュリティと安全性を高めるこ...

機械学習を使用すべきでないのはどのような場合ですか?

[[330426]]ビッグデータダイジェスト制作出典: towarddatascience著者: ...

9 つの SOTA GNN よりも強力です。 Google Brainが新しいグラフニューラルネットワークGKATを提案

[[413820]]グラフは、ソーシャル ネットワークからバイオインフォマティクス、ロボット工学の...

...

ディープマインド主任科学者:私は機械知能よりも人間の知能が引き起こす災害を心配している

ディープマインドの主任研究科学者であり、ロンドン大学ユニバーシティ・カレッジのコンピューターサイエン...

近年の機械学習の奇妙な状況

翻訳者注:人工知能分野の発展は学者の貢献と切り離せないものです。しかし、研究が進むにつれて、「クリッ...

人工知能開発の動向

ケビン・ケリー氏は「人工知能は人類社会を混乱させる次のものだ」と語った。 2020年は、全世界が前例...

機械学習の基本概念を10枚の画像で説明する

機械学習の基本的な概念を説明するとき、私はいつも限られた数の図に戻ってしまいます。以下は、私が最も啓...

百人一首の戦いはかつてないレベルに到達!

執筆者 | 王 瑞平校正 | Yun Zhao最近また「100均戦争」が始まってます…一輪の花が春を...

OpenAIは、GPT-4の「怠惰」問題を近い将来に修正し、オフライン評価とA/Bテストの後にモデルを更新すると発表した。

IT Homeは12月12日、OpenAIが先週、一部のユーザーから苦情を受けたと報じた。多くのユ...

2023年以降を一変させる5G IoTテクノロジートップ10

IoT 分野の拡大と発展により、多くの変革的テクノロジーがもたらされるでしょう。家庭から自動車、ウ...

[文字列処理アルゴリズム] 文字列を整数に変換するアルゴリズム設計とCコード実装

1. 要件の説明数字の文字列を入力し、その文字列を整数に変換して出力するプログラムを作成します。たと...