ホテルは機械学習を使ってどのゲストが立ち上がるかを予測する

ホテルは機械学習を使ってどのゲストが立ち上がるかを予測する

現在、主要なOTA(オンライン旅行代理店)プラットフォームは人々の旅行を大幅に容易にしています。ホテルの宿泊施設、アトラクションのチケットなどは、数回クリックするだけで簡単に予約できます。

国内外にはホテルやホームステイの予約プラットフォームが数多くある

より多くのユーザーを予約に誘致するために、これらのプラットフォームは、いつでも無料でキャンセルできる、または限られた時間内で無料でキャンセルできるなど、より緩やかなキャンセルポリシーを設定するよう販売者に奨励するでしょう。

客室販売数で世界最大のオンラインホテル予約サイトであるBooking.comは、無料キャンセルの利点から旅行者の間で人気があります。

しかし、「無料キャンセル」はユーザーにとっては非常に嬉しいのですが、ホテルにとっては頭痛の種です。注文を一時的にキャンセルすると、ホテルには通常次のような損失が発生します。

  1. キャンセルされた客室は時間内に販売できず、ホテルは収益を失います。
  2. ホテルはキャンセルされた客室を販売するために料金を値下げし、利益が減少
  3. これらの部屋をできるだけ早く予約するために、ホテルは宣伝と流通チャネルに追加のコストを負担する必要があります。

利用者がいつでもホテルを立ち退くことができる場合、ホテル側が損失を最小限に抑える方法はあるのでしょうか?

ポルトガルのビジネスアナリスト(BA、IT 企業のプロダクトマネージャーに相当する役職)であるマヌエル・バンザは、ホテル経営で 5 年以上の経験を持っています。彼は、ヨーロッパのホテル予約プラットフォームの公開データを活用して、注文をキャンセルする可能性が高いユーザーの特徴を発見し、ホテルがタイムリーに損失を食い止められるよう支援しました。

約12万件のホテル予約データからパターンを発見

データ サイエンスの愛好家である Manuel Banza は、データ サイエンスと機械学習からスタートしました。

彼はまず、「ホテル予約需要データセット」の包括的な分析を実施しました。このデータセットには、次のものを含む、一般的なホテルとリゾートホテルの 32 次元のデータが含まれています。

ユーザーの国籍、予約時間、滞在期間、大人と子供または幼児の数、注文が最終的にキャンセルされたかどうか、ユーザーがこの注文の前に注文をキャンセルした合計回数などの情報。

ホテル予約需要

ホテル予約需要データセット

発行機関: ポルトガル、リスボン大学

含まれる項目数: 32次元の119,390データ項目

データ形式: csv

データサイズ: 16.9 MB (圧縮ファイルの場合は 1.3 MB)

アドレス: https://hyper.ai/datasets/14866

部分的なデータ表示

マヌエル・バンザは統計を通じて、1年間で多数のユーザーがホテルの予約をキャンセルしたことを発見しました。

2018年、OTAプラットフォームBookingでの予約をキャンセルしたユーザーは49.8%に上り、HRSグループではその割合は66%にまで達しました。全体として、複数のプラットフォームの平均予約注文キャンセル率は、2018 年に 39.6% に達しました。

さまざまな予約チャネルでキャンセルされた注文の割合

次に、著者はデータの探索的分析を実施し、次のことを発見しました。

  • 一般のホテルやリゾートホテルに比べ、宿泊客による予約キャンセルの可能性が高くなります。
  • キャンセル率は春節と夏季に高くなり、冬季に最も低くなります。
  • さまざまな予約チャネルの中で、ユーザーは OTA プラットフォームで最も多くの注文を行っていますが、最も多くの注文が OTA プラットフォームでキャンセルされています。
  • ユーザーが予約を早く行うほど、不確実性が高まり、キャンセルの可能性が高くなります。

著者らは、ホテルの収益実績を分析する際に、予約時間は最も重要な指標の 1 つであると述べています。分析結果によると、1年以上先の予約の場合、キャンセル確率は57.14%と最も高く、1週間以内の予約の場合、キャンセル確率は7.73%と最も低いことがわかりました。

予約前の日数(横軸)はキャンセルの可能性(縦軸)に比例する

早めに計画を立てれば立てるほど、変化に対応できなくなる可能性が高くなるようです。

機械学習モデル: 誰が立ち上がる可能性が高いかを予測する

データセットを徹底的に分析した後、著者らは注文のキャンセルを予測するモデルの構築を開始しました。

ステップ1: データのクリーニング

まず、データセット内の欠損値を処理します。これらの欠損値は、変数が数値の場合は特徴量の平均に、変数がカテゴリの場合は定数に置き換える必要があります。

次に、機械学習モデルが予測する値であるreservation_status(注文がキャンセルされたかどうかを表す予約ステータス。キャンセルされていない場合は 0、キャンセルされた場合は 1)を削除します。

ステップ2: 最適なモデルを選択する

データに最適なアルゴリズムのテストを開始する前に、データセットを 8:2 の比率で分割します。その後、データの 80% はモデルのトレーニングに使用され、データの 20% は検証セットとして使用されます。

データ サイエンスの分野では、注文のキャンセルを予測することは、バイナリ分類とも呼ばれる教師あり分類問題です。そのため、著者はトレーニングと比較のために、LightGBM、CatBoost、XGBoost、H2O などの既存のバイナリ分類モデルをいくつか選択し、最終的に最良の実験結果が得られた CatBoost モデルを選択しました。

CatBoost の予測結果から、次の点がわかりました。

  1. ユーザーの国籍がポルトガル人の場合、キャンセルされる可能性が高くなります。ただし、団体予約の場合、ホテルは通常、各人の国籍情報を事前に取得しません。予約がキャンセルされた場合、ほとんどのホテルでは国籍はホテルの所在国にデフォルト設定されます。したがって、この情報は参考用であり、正確ではない可能性があります。
  2. 特別なリクエストを一切行わなかったユーザーは、少なくとも 1 つの特別なリクエストを行ったユーザーよりも注文をキャンセルする可能性が高かった。
  3. lead_time(予約時刻からチェックイン時刻までの日数)の値が低いほど、予約キャンセルの可能性が低くなります(この予測結果は、これまでのデータ分析結果と一致しています)。

[[390579]]

ポルトガルの人気ホテル「ユーロスターズ・ミュージアム」では考古学の展示が行われている

複数のOTAプラットフォームで開始し、オンライン予約と無料キャンセルをサポート

検証セットにおける CatBoost モデルのパフォーマンス:

「ホテル予約需要」データセット全体のパフォーマンス:

ホテル:キャンセルする前にお金を貯めましょう

この予測モデルを使用することで、ホテルはどのユーザーが注文をキャンセルする可能性が高いかを事前に把握し、タイムリーな是正措置を講じることができます。

たとえば、キャンセルする可能性が高いユーザーに事前に連絡し、コミュニケーションを通じてできるだけ早くキャンセルするよう促すことで、ホテルは客室を販売する時間を増やすことができます。

あるいは、キャンセルする傾向があるユーザーに連絡して、ホテルの利点を紹介し、滞在特典を提供して流れを変え、ユーザーを維持することもできます。

<<:  Facebook、動画から学習する新たなAIプロジェクトを開始

>>:  人工知能は若者を失業させるでしょうか? 996に圧倒されないでください。そうしないとチャンスがなくなります。

ブログ    
ブログ    
ブログ    
ブログ    

推薦する

顔認識を禁止した後、サンフランシスコは検察官の事件処理を支援するためにAIを活用

最近、海外メディアの報道によると、サンフランシスコ市は7月1日に導入予定の「偏見削減ツール」を発表し...

Kaggle マスターはどのような言語、フレームワーク、モデルを使用していますか?詳細な統計はこちら

統計ウェブサイト: https://mlcontests.com/ 著者はいくつかの重要な結論に達し...

人工知能の登場により、私たちは仕事を維持できるのでしょうか?

週末にニュースを見て衝撃を受けました。Google は最近、同社が開発したロボット (AI) システ...

...

テスラの自動操縦装置が別の人をはねて死亡させ、被害者の家族が訴訟を起こす

電気自動車メーカー、テスラの自動操縦機能に関連する死亡事故がまた発生した。被害者は高速道路脇でモデル...

アダプティブコンピューティングがAI製品化の課題にどのように対処するか

[[389356]]今日、人工知能技術は急速に発展しており、イノベーションのペースは加速しています。...

...

...

大規模グラフニューラルネットワークの応用と最新のパラダイムの探究

1. 大規模グラフメモリ/計算問題を解決するための3つのパラダイム2年前に作成したチュートリアルでは...

動作計画のための探索アルゴリズム: フロントエンド計画、バックエンド軌道生成から状態解まで

この記事は、Heart of Autonomous Driving の公開アカウントから許可を得て転...

米国が中国へのAIソフトウェア輸出制限を発表、ドローンと自動運転が最初に影響を受ける

2020年が到来。テクノロジー規制は改善されたのでしょうか? [[311882]]空想を捨てなさい。...

トロント大学のデュヴノーチームは確率微分方程式を組み合わせて、無限深ベイズニューラルネットワークを提案した。

[[433557]]ニューラル ネットワークの制限を無限の数の残差層の組み合わせとして見ると、その...

不正使用を防ぐため、DJIはロシアとウクライナへの販売を停止すると発表した。

DJIは4月26日、ロシアとウクライナでの事業を一時停止すると発表した。戦闘で使用されないように注...

マスクは想像力が豊かだ!コンピュータと人間の脳を融合する

[51CTO.com からのオリジナル記事] ウォールストリートジャーナルの最近の報道によると、テク...