ホテルは機械学習を使ってどのゲストが立ち上がるかを予測する

ホテルは機械学習を使ってどのゲストが立ち上がるかを予測する

現在、主要なOTA(オンライン旅行代理店)プラットフォームは人々の旅行を大幅に容易にしています。ホテルの宿泊施設、アトラクションのチケットなどは、数回クリックするだけで簡単に予約できます。

国内外にはホテルやホームステイの予約プラットフォームが数多くある

より多くのユーザーを予約に誘致するために、これらのプラットフォームは、いつでも無料でキャンセルできる、または限られた時間内で無料でキャンセルできるなど、より緩やかなキャンセルポリシーを設定するよう販売者に奨励するでしょう。

客室販売数で世界最大のオンラインホテル予約サイトであるBooking.comは、無料キャンセルの利点から旅行者の間で人気があります。

しかし、「無料キャンセル」はユーザーにとっては非常に嬉しいのですが、ホテルにとっては頭痛の種です。注文を一時的にキャンセルすると、ホテルには通常次のような損失が発生します。

  1. キャンセルされた客室は時間内に販売できず、ホテルは収益を失います。
  2. ホテルはキャンセルされた客室を販売するために料金を値下げし、利益が減少
  3. これらの部屋をできるだけ早く予約するために、ホテルは宣伝と流通チャネルに追加のコストを負担する必要があります。

利用者がいつでもホテルを立ち退くことができる場合、ホテル側が損失を最小限に抑える方法はあるのでしょうか?

ポルトガルのビジネスアナリスト(BA、IT 企業のプロダクトマネージャーに相当する役職)であるマヌエル・バンザは、ホテル経営で 5 年以上の経験を持っています。彼は、ヨーロッパのホテル予約プラットフォームの公開データを活用して、注文をキャンセルする可能性が高いユーザーの特徴を発見し、ホテルがタイムリーに損失を食い止められるよう支援しました。

約12万件のホテル予約データからパターンを発見

データ サイエンスの愛好家である Manuel Banza は、データ サイエンスと機械学習からスタートしました。

彼はまず、「ホテル予約需要データセット」の包括的な分析を実施しました。このデータセットには、次のものを含む、一般的なホテルとリゾートホテルの 32 次元のデータが含まれています。

ユーザーの国籍、予約時間、滞在期間、大人と子供または幼児の数、注文が最終的にキャンセルされたかどうか、ユーザーがこの注文の前に注文をキャンセルした合計回数などの情報。

ホテル予約需要

ホテル予約需要データセット

発行機関: ポルトガル、リスボン大学

含まれる項目数: 32次元の119,390データ項目

データ形式: csv

データサイズ: 16.9 MB (圧縮ファイルの場合は 1.3 MB)

アドレス: https://hyper.ai/datasets/14866

部分的なデータ表示

マヌエル・バンザは統計を通じて、1年間で多数のユーザーがホテルの予約をキャンセルしたことを発見しました。

2018年、OTAプラットフォームBookingでの予約をキャンセルしたユーザーは49.8%に上り、HRSグループではその割合は66%にまで達しました。全体として、複数のプラットフォームの平均予約注文キャンセル率は、2018 年に 39.6% に達しました。

さまざまな予約チャネルでキャンセルされた注文の割合

次に、著者はデータの探索的分析を実施し、次のことを発見しました。

  • 一般のホテルやリゾートホテルに比べ、宿泊客による予約キャンセルの可能性が高くなります。
  • キャンセル率は春節と夏季に高くなり、冬季に最も低くなります。
  • さまざまな予約チャネルの中で、ユーザーは OTA プラットフォームで最も多くの注文を行っていますが、最も多くの注文が OTA プラットフォームでキャンセルされています。
  • ユーザーが予約を早く行うほど、不確実性が高まり、キャンセルの可能性が高くなります。

著者らは、ホテルの収益実績を分析する際に、予約時間は最も重要な指標の 1 つであると述べています。分析結果によると、1年以上先の予約の場合、キャンセル確率は57.14%と最も高く、1週間以内の予約の場合、キャンセル確率は7.73%と最も低いことがわかりました。

予約前の日数(横軸)はキャンセルの可能性(縦軸)に比例する

早めに計画を立てれば立てるほど、変化に対応できなくなる可能性が高くなるようです。

機械学習モデル: 誰が立ち上がる可能性が高いかを予測する

データセットを徹底的に分析した後、著者らは注文のキャンセルを予測するモデルの構築を開始しました。

ステップ1: データのクリーニング

まず、データセット内の欠損値を処理します。これらの欠損値は、変数が数値の場合は特徴量の平均に、変数がカテゴリの場合は定数に置き換える必要があります。

次に、機械学習モデルが予測する値であるreservation_status(注文がキャンセルされたかどうかを表す予約ステータス。キャンセルされていない場合は 0、キャンセルされた場合は 1)を削除します。

ステップ2: 最適なモデルを選択する

データに最適なアルゴリズムのテストを開始する前に、データセットを 8:2 の比率で分割します。その後、データの 80% はモデルのトレーニングに使用され、データの 20% は検証セットとして使用されます。

データ サイエンスの分野では、注文のキャンセルを予測することは、バイナリ分類とも呼ばれる教師あり分類問題です。そのため、著者はトレーニングと比較のために、LightGBM、CatBoost、XGBoost、H2O などの既存のバイナリ分類モデルをいくつか選択し、最終的に最良の実験結果が得られた CatBoost モデルを選択しました。

CatBoost の予測結果から、次の点がわかりました。

  1. ユーザーの国籍がポルトガル人の場合、キャンセルされる可能性が高くなります。ただし、団体予約の場合、ホテルは通常、各人の国籍情報を事前に取得しません。予約がキャンセルされた場合、ほとんどのホテルでは国籍はホテルの所在国にデフォルト設定されます。したがって、この情報は参考用であり、正確ではない可能性があります。
  2. 特別なリクエストを一切行わなかったユーザーは、少なくとも 1 つの特別なリクエストを行ったユーザーよりも注文をキャンセルする可能性が高かった。
  3. lead_time(予約時刻からチェックイン時刻までの日数)の値が低いほど、予約キャンセルの可能性が低くなります(この予測結果は、これまでのデータ分析結果と一致しています)。

[[390579]]

ポルトガルの人気ホテル「ユーロスターズ・ミュージアム」では考古学の展示が行われている

複数のOTAプラットフォームで開始し、オンライン予約と無料キャンセルをサポート

検証セットにおける CatBoost モデルのパフォーマンス:

「ホテル予約需要」データセット全体のパフォーマンス:

ホテル:キャンセルする前にお金を貯めましょう

この予測モデルを使用することで、ホテルはどのユーザーが注文をキャンセルする可能性が高いかを事前に把握し、タイムリーな是正措置を講じることができます。

たとえば、キャンセルする可能性が高いユーザーに事前に連絡し、コミュニケーションを通じてできるだけ早くキャンセルするよう促すことで、ホテルは客室を販売する時間を増やすことができます。

あるいは、キャンセルする傾向があるユーザーに連絡して、ホテルの利点を紹介し、滞在特典を提供して流れを変え、ユーザーを維持することもできます。

<<:  Facebook、動画から学習する新たなAIプロジェクトを開始

>>:  人工知能は若者を失業させるでしょうか? 996に圧倒されないでください。そうしないとチャンスがなくなります。

ブログ    
ブログ    

推薦する

ディープラーニングを使用して映画を推奨するにはどうすればよいでしょうか?独自の推奨システムを作成する方法を教えます!

導入ほとんどすべての人が、家族や友人と一緒に映画を観ながら余暇を過ごすのが好きです。誰でもこんな経験...

AI セキュリティの大手企業は 2020 年にどのような行動を取るのでしょうか?

7月9日から7月11日まで、2020年世界人工知能会議クラウドサミットが上海で閉幕しました。「イン...

...

...

企業や不動産管理会社が課す顔認識要件をどのように規制するか?あなたの権利を守るには?

[[429833]]ショッピングモールは顔認識カメラをオンにし、情報は「気付かれずに」収集されます...

GIF 圧縮アルゴリズムの発明者が IEEE の最高栄誉賞を受賞

この記事はAI新メディアQuantum Bit(公開アカウントID:QbitAI)より許可を得て転載...

ドローン技術を都市計画に活用

ドローン技術は、都市計画がスマートシティを形成する方法を再定義するでしょう。都市計画は変化しており、...

「小学生」は荷物受け取りのためのFengchaoの顔スキャンシステムを解読できるのか?

資金が足りない、2Dで補う? 先日、Fengchaoのスマートエクスプレスロッカーが「小学生」によっ...

...

AIは生産性を低下させるでしょうか?今のところは出演はありません!

[[286440]] ▲ イラスト出典:エドモン・デ・ハロ2016年、ロンドンに拠点を置くアルファ...

2024年のデータセンターのトレンド: より高温、より高密度、よりスマート

今日のデータセンター業界は、AI テクノロジーの急速な普及、ムーアの法則の減速、そして厄介な持続可能...

Facebookはライブ動画でユーザーを見えなくする匿名化システムを開発した

最近、ノルウェー科学技術大学の「DeepPrivacy: 顔の匿名化のための生成的敵対的ネットワーク...

梅の花の山の上を歩くロボット犬?自転車は自分でバランスをとることができますか?テンセント・ロボティクスXラボ研究初の「開封」

テンセントは11月20日、移動ロボット研究における新たな進展を発表し、四足移動ロボット「ジャモカ」と...

Java 実装と読み取り/書き込みロック アルゴリズムの考え方

問題の背景: 複数のスレッドが共有リソースへの読み取りおよび書き込みアクセスを実行します。書き込みス...