Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >携程:机器学习在酒店服务领域的实践

携程:机器学习在酒店服务领域的实践

作者头像
CSDN技术头条
发布于 2018-02-12 02:00:48
发布于 2018-02-12 02:00:48
1.5K0
举报
文章被收录于专栏:CSDN技术头条CSDN技术头条

在携程技术中心推出的线上公开课程[携程技术微分享]上,携程酒店研发BI经理潘鹏举介绍了如何借助大数据和算法,通过机器学习去克服酒店服务行业挑战。目前的应用主要包括订单量预测、回复市场预测、询房预测和用户价格偏好预测。采用的算法包括GBM、SVD++、XGBoost以及集成建模等。

携程是一家在线OTA服务公司,特点包括天生限时限购、每个酒店库存固定、代理房型、与酒店直接谈合作房型等。作为第三方平台,OTA酒店行业也面临众多挑战,比如无法掌握实际库存,依赖酒店行为;有些酒店设备落后,导致无法系统直连、无法接入EBK系统,所以管理起来比较困难。

酒店服务主要从好、快、准三个方面来衡量。“好”的KPI包括“到店无房率”和“到店无预订率”,“快”包括“订单确认时长”和“立即确认率”,“准”则包括了“信息准”、“价格准”、“房态准”。随着业务量的持续增长,持续增加客服人员来维持高服务水准就变得不太现实,借助于技术手段来实现自动化、智能化是一个很好的方向,机器学习算法在其中扮演了一个很重要的角色。

数据应用与模型评估

携程每天产生2亿PV,10TB的数据量。但数据大!=价值大,其中用到的数据大体分成四块:业务数据、网站性能数据、用户行为数据和爬虫数据,实践中主要会用到业务数据和用户行为数据,业务数据包括了订单数据、房态、房价等数据,用户行为数据包括了用户点击、浏览等数据。

一般性数据时效性越高,数据价值越大。未来的人工智能就是基于过去和当前的状态来预测未来,再用预测来影响未来。如果只用冷数据即过去的数据,比如统计报表、数据分析,那么可以挖到银矿,因为分析过去的数据只能控制未来不会犯同样的错误,但若结合过去和当下的数据预测了未来,那么可以挖到钻石,因为可以用预测结果和实际进行对比发现新的黑天鹅现象,从而来指导业务进行转变。

另外可能会有一个误区,我们都想要追求100%准确的数据。实际上,数据很难100%准确,尤其是用户行为数据,任何一种采集方式都会有PV漏记、错记的情况。因此我们要能容忍一定的数据采集偏差,在现有的数据中看如何利用数据创造价值。

还要注意,在算法应用到线上的过程中,人工经验、人工过滤以及风控会起到很关键的作用。如果没有做到这点,那么在实际应用中会大打折扣。正如人是商业的CPU,决策过程中要依赖人来调整方向。而风控是决定应用快慢的GPU,如果没有做好风控措施,不仅可能会导致业务损失也有可能让算法没有发挥出作用。

将理念运用到实践过程中,有三种常用的模型评估方法:

  • A/BTest: AA测试用来评估分流是否随机,该方法在项目中使用率较高;
  • 隔周/隔天对比:为了替代A/BTest的简单办法,针对有些情况下面很难做AB实验;
  • 模型空跑:评估+风控的方式,先上线模型,但是业务不采纳模型结果,然后用log解析模型是否运转正确及效果。

机器学习提升用户预订体验

携程按照预定流程,区分了预订前、中、后流程,主要目的是为了提升客户体验和提高服务效率。预订前的主要目的是为了让信息更加准确、预订中主要是为了提升预订效率和速度,预订后就是为了订单风控、酒店风控和客人风控。

订单量预测应用

我们通过应用进行业务监控,做到准实时,延迟一分钟预测。从预测到应用,其实运用了简单的ARIMA+季节系数+人工调整算法,设计出模型。评估指标主要是看漏报率,不同阶段重点不同,在稳定期间,误报率较为重要,因为系统稳定了,需要尽量减少人力损失。

回复时长预测应用

在服务指标中,“快”体现了我们的服务速度,有两个重要KPI:立即确认和订单确认时长。我们有个业务逻辑叫保留房,是酒店承诺给携程的库存量。针对保留房我们可以立即确认订单给客人,确认时长为零。针对非保留房,确认速度比较慢,需要等酒店回复信息之后才能确认订单给客人,导致客人体验差,当然并不是所有的酒店都愿意和我们签订保留房,并且保留房有时间限制,到了入住日晚上X点以后,保留房就失效了,所以非保留房的存在,决定了“快”的服务水准。针对提高非保留房的服务水准是我们的一个很重要的课题。

确认流程简图

对整个流程进行分析,我们发现有两个可以优化的点:

  • 非保留房的确认率90%+,意味着推翻的订单10%都不到,如果我们可以对非保留房里面的确认概率高(确认准确率99%+,与保留房的确认率持平)的订单先确认,那么实际上非保留房的流程可以遵循保留房的流程,暂且称为虚拟保留房。针对怎么挑出这些确认概率高的订单命题,机器学习算法就起作用了;
  • 红色部分“等待至X分钟“设置的不合理,因为有些酒店在X分钟内是肯定不回传的,还要硬等X分钟,导致很多订单确认时长就白白多了X分钟。那么针对哪些订单是肯定不回传,哪些是回传的命题,机器学习算法就发挥作用了。

针对这两个优化的点,我们嵌入了两个机器学习模型,我们看一下优化后的流程是怎么样的:

从红色部分的两个模型上可以看到,虚拟保留房可以新增立即确认订单占比,从而提高确认速度;酒店回传时长预测模型优化了现有的订单外呼流程,针对有部分的时长过长的订单提前干预,从而缩短了整体的确认时长。

我们看一下模型最终的效果,虚拟保留房预测模型准确率99%+,酒店回传时长预测模型准确率93%+。整体提升立即确认率5%,缩短平均确认时长约2分钟。通过以上的案例可以看到,模型很好的提升了用户的预订体验,取得了不错的效果。

机器学习提升大户室询房效率

过去,询房主要是人工经验为主,经理们会根据过去的房型预订情况和区域紧张度情况,筛选出今天要重点询问的酒店列表,然后大户室人员会对酒店列表打电话询问房态,酒店数量庞大,人工询问的电话量有限,如何提升询房有效率,即每通电话的有效性是个很棘手的问题。

过去一年,我们着力于使用机器学习算法来预测酒店的房态和技术手段持续的优化流程,提高询房有效性,通过算法筛选询房酒店比人工经验筛选的有效性从25%左右提升到了50%+,这是个很显著的提升,可以大大节省人工成本,提高工作效率。

以下是优化后的流程:

简单的说是变化的是两个模型+IVR自动外呼。自动开房模型采用GBM和SVD++,关满房模型采用XGBoost。过这两个模型,我们把房态变化概率高的酒店先筛选出来,放在询房看板上。IVR自动外呼概率高的酒店。通过这一流程改造,我们尽量实现了询房的自动化、智能化。但目前的决策过程中,对准确率不高的房型会有必要的人工介入,然后针对风险的高低,我们会有不同的风控和措施,这样的结合才能让算法的作用最大化。

算法经验

模型项目完整流程包括确定目标、变量设计评审、变量数据准备、线下数据校验、训练&优化模型、模型上线开发、模型空跑测试、模型上线、模型监控等。在携程的场景下,线下数据校验、模型空跑测试和模型监控比较重要。

模型训练方面,特征工程和其他团队的做法区别不大,如下图所示:

特别说明两点:

  • 缺失值预测,如果某些变量对业务帮助很大,但是有一定量的缺失值,那么我们可用另一个模型来预测缺失值,做法就是取出关键变量不存在缺失值的样本进行训练,然后对有缺失值的变量进行预测。
  • 另外还有归一化问题,目前常用的机器学习方法是GBM、XGBoost对量纲不敏感,所以为了减少数据分布的损失较少做归一化。在实际应用中,有些模型是一定要求归一化,因此还是需要进行归一化处理。

模型经验总结如下:

  1. 有时候单纯提升变量时效性会显著提高模型的预测能力,前提先证明时效性对结果是有提升的;
  2. 以XGBoost/GBM/GBDT(基于SGD和Boosting思想的,叫法和package不同)预测出来的模型当做Baseline,进行后续的优化方向;
  3. 数据校验很重要,多做数据校验;
  4. 多花时间挖掘出有用的Feature,新增变量+变量转换;
  5. 线下训练的模型快速上线,针对线上数据进行参数调优和模型优化;
  6. 基本上使用非线性模型,效果好于线性模型。

特别说明第5点,线下模型上线,根据线上数据进行调优,主要是担心线上上线过程中有人为失误导致数据计算有偏差,所以可以直接根据线上模型来进行模型优化来适应线上的开发错误,并且能够快速的定位出开发中的数据错误。

对于非线性关系,效果和算法之间的关系如下图所示:

从图中看出,集成建模的效果最好。携程常用的模型融合方法是Stacking和Blending,具体可以参考http://mlwave.com/kaggle-ensembling-guide/。

综上所述,机器学习算法可以帮助公司创造出价值。目前来看,我们的数据利用只是数据价值的冰山一角,也借此机会希望大家多思考一下数据的利用价值,让数据发挥出应有的价值。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-05-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CSDN技术头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
携程:机器学习在酒店服务领域的实践
在携程技术中心推出的线上公开课程[携程技术微分享]上,来自携程酒店研发的BI经理潘鹏举,介绍了如何借助大数据和算法,通过机器学习去克服酒店服务行业挑战,给用户带来更好的服务体验,给公司带来效率提升,希望能对你有所启发。 携程是一个在线OTA服务公司。不同于其他行业,酒店OTA有一些自己的特点,比如天生限时限购、每个酒店库存固定、跟酒店直接谈合作房型等。作为第三方平台,OTA酒店行业也面临众多挑战,比如我们无法掌握实际库存,依赖酒店行为;有些酒店设备落后,导致无法系统直连、无法接入EBK系统,所以管理起来比较
逸鹏
2018/04/10
7990
携程:机器学习在酒店服务领域的实践
干货 | 携程技术演进之路
李小林,携程技术副总裁,平台研发中心负责人。从事IT互联网技术研发工作二十多年,目前负责携程基础设施平台。本文来自李小林在“2018携程技术峰会”上的分享。
携程技术
2019/04/22
2.1K0
干货 | 携程技术演进之路
干货 | 携程酒店浏览客户流失概率预测
作者简介 陈无忌,就读于中国科学技术大学计算机学院,15 级硕士研究生。研究方向机器学习、大数据、智能交通等。在校期间多次参加大数据竞赛,在携程云海平台比赛中,两次和队伍一起获得第一名。 客户流失率是考量是业务成绩的一个非常关键的指标。根据历史数据建立模型,使用机器学习的方法预测客户流失概率,可以找出用户流失的因素,从而完善产品,减少客户流失概率。 那么,对于这样的一个问题,我们需要做哪些数据分析?特征又是如何提取?如何选择合适的机器学习模型?如何调整模型的参数?同时对于类似的这些问题,又有什么常见的套路
携程技术
2018/03/16
7K0
干货 | 携程酒店浏览客户流失概率预测
干货 | 用户画像在携程商旅的实践
用户画像这一概念最早源于交互设计领域,由交互设计之父Alan Cooper提出。其指出用户画像是真实用户的虚拟代表,是建立在真实数据之上的目标用户模型。具体而言,在互联网用户分析领域,用户画像可以简单描述为用户信息标签化,即通过收集并分析用户的社会属性、生活习惯、消费偏好等各维度的数据,从而抽象出用户的全方位多视角的特征全貌,最终就是让用户画像比用户更了解自己。
携程技术
2020/07/20
2.6K0
干货 | 万字长文详解携程酒店订单缓存 & 存储系统升级实践
作者简介 荣华,携程高级研发经理,专注于后端技术项目研发管理。 军威,携程软件技术专家,负责分布式缓存系统开发 & 存储架构迁移项目。 金永,携程资深软件工程师,专注于实时计算,数据分析工程。 俊强,携程高级后端开发工程师,拥有丰富SQLServer使用经验。 前言 携程酒店订单系统的存储设计从1999年收录第一单以来,已经完成了从单一SQLServer数据库到多IDC容灾、完成分库分表等多个阶段,在见证了大量业务奇迹的同时,也开始逐渐暴露出老骥伏枥的心有余而力不足之态。基于更高稳定性与高效成本控制而设计
携程技术
2022/04/29
2.2K0
干货 | 万字长文详解携程酒店订单缓存 & 存储系统升级实践
酒店用机器学习,预测哪些客人会放鸽子
内容提要:如今,大数据已经被各行各业所应用,酒店行业也不例外。充分利用大数据,使得酒店能够预测市场需求变化,进行智能化决策分析,改善经营状况。
HyperAI超神经
2021/04/14
7710
机器学习在金融风控的经验总结!
由于金融风控场景的特殊性,很多算法同学在刚进入这个领域容易“水土不服”,为了使机器学习项目(也包括图算法相关的应用)落地更加顺利,本文介绍下实践过程的一些经验和踩过的坑。
Sam Gor
2020/09/22
1.9K0
机器学习在金融风控的经验总结!
干货 | 故障召回率提升34%,携程智能异常检测实践
携程作为在线旅游公司,对外提供机票、酒店、火车票、度假等丰富的旅游产品,其系统稳定性关乎用户是否具有顺滑的出行体验。然而,流量激增、代码发布、运维变更等都会给系统稳定性带来挑战。
携程技术
2023/09/06
1K0
干货 | 故障召回率提升34%,携程智能异常检测实践
Python酒店预订数据:随机森林与逻辑回归模型ROC曲线可视化
在数字化运营的浪潮中,酒店行业的预订数据俨然成为一座待开采的金矿。作为数据科学领域的探索者,我们对城市酒店与度假酒店的预订数据集展开深度剖析(点击文末“阅读原文”获取完整智能体、代码、数据、文档)。
拓端
2025/06/15
1040
Python酒店预订数据:随机森林与逻辑回归模型ROC曲线可视化
干货 | 携程个性化推荐算法实践
作者简介 携程基础业务研发部-数据产品和服务组,专注于个性化推荐、自然语言处理、图像识别等人工智能领域的先进技术在旅游行业的应用研究并落地产生价值。目前,团队已经为携程提供了通用化的个性化推荐系统、智能客服系统、AI平台等一系列成熟的产品与服务。 携程作为国内领先的OTA,每天向上千万用户提供全方位的旅行服务,如何为如此众多的用户发现适合自己的旅游产品与服务,挖掘潜在的兴趣,缓解信息过载,个性化推荐系统与算法在其中发挥着不可或缺的作用。而OTA的个性化推荐一直也是个难点,没有太多成功经验可以借鉴,本文分享
携程技术
2018/03/16
2.4K0
干货 | 携程个性化推荐算法实践
干货 | 携程图像智能化建设之路
作者简介 李翔,携程数据智能部信息科学组图像技术负责人,专注于计算机视觉和机器学习的研究和应用,现阶段致力于酒店图像智能化,在包括ICCV和CVPR在内的学术会议和国际期刊上发表10余篇论文。 携程作为OTA行业的领跑者,拥有全球百万家酒店数以亿计的酒店图像,酒店图像数量还在以每天数十万的速度增长。面对海量酒店图像,如何完成智能处理与挖掘,大幅减少图像的人工干预,又如何实现智能应用,改善用户获取酒店信息的速度、准确性和完整性,提高用户满意度,这些都成为急需解决的问题。 相比学术界追求的模型创新性,我们更加关
携程技术
2018/07/05
8680
干货 | 为了给你更好的体验,携程做了个“一站式”客服机器人
经纬,从事客服机器人的算法研发工作,专注于nlp领域的算法研究和应用,喜欢数据和场景驱动的算法研发。
携程技术
2020/06/24
8000
干货 | 为了给你更好的体验,携程做了个“一站式”客服机器人
干货 | 携程是如何借助“预测式外呼”提高呼叫效率的
作者简介 本文作者为携程基础业务研发部呼叫中心团队,其在传统呼叫中心基础上,结合软交换、智能分配、自动语音语义处理等技术,为携程用户提供人性化、人机互动、便捷的电话语音服务。 携程目前拥有15000+座席,日均电话呼出量30W左右,在如此规模的呼叫中心外呼业务中,我们不断尝试着去降低座席等待时长、提高外呼效率,从而为业务提供更加值得依赖的呼叫中心服务。 作为纯软平台,由携程自主研发的SoftPBX系统具有强大的功能灵活性与可扩展性,这也为提升座席外呼工作效率提供了技术可行性:根据算法预测出将要空闲的座席人数
携程技术
2018/03/16
5K0
干货 | 携程是如何借助“预测式外呼”提高呼叫效率的
微分享回放 | 数据分析在携程产品设计中的应用
【携程技术微分享】是携程技术中心推出的线上公开分享课程,每月1-2期,采用目前最火热的直播形式,邀请携程技术人,面向广大程序猿和技术爱好者,一起探讨最新的技术热点,分享一线实战经验。 【讲师简介】林传毅,携程酒店UED资深交互设计师,2013年加入携程,负责酒店前后台产品设计及客栈通的整体设计。加入携程前曾就职解放日报和柯达中国,同时也是家庭记录APP《树说家语》的联合创始人。 *视频时长46分钟,请在WiFi环境下观看* 数据与设计的关系,业界向来颇多热议——有“数据驱动设计”之说,有“数据引导设计”之论
携程技术
2018/03/16
9740
微分享回放 | 数据分析在携程产品设计中的应用
干货 | 机器学习在酒店呼叫中心自动化中的应用
作者简介 周振伟,携程数据智能部数据科学工程师,同济大学硕士,主要承担酒店服务领域的数据分析和挖掘工作。 无论是出门旅游还是商务出行,在外能有一个舒适的住处,往往都是首先要解决的问题。OTA提供的酒店预订功能无疑为此提供了巨大的便利。 打开携程APP,看中一家不错的酒店下单后,会有一个等待酒店确认的过程。携程将用户预订的消息发送给酒店,酒店进行查房,确认是否有空余房间,然后回复携程,再由携程通知用户确认结果。这个过程通常在半小时到一小时内完成,很多时候只需十分钟,在这背后,携程的呼叫中心起到了重要的作用。
携程技术
2018/03/16
1.5K0
干货 | 机器学习在酒店呼叫中心自动化中的应用
机器学习在马蜂窝酒店聚合中的应用初探
出门旅行,订酒店是必不可少的一个环节。住得干净、舒心对于每个出门在外的人来说都非常重要。
Spark学习技巧
2021/03/05
9910
机器学习在马蜂窝酒店聚合中的应用初探
干货 | 机器学习模型在携程海外酒店推荐场景中的应用
Louisa,携程算法工程师,热爱前沿算法和技术在个性化推荐和广告建模等业务的性能优化和落地。
携程技术
2020/08/18
1.5K0
干货 | 机器学习模型在携程海外酒店推荐场景中的应用
干货 | 携程酒店实时数仓架构和案例
当前,企业对于数据实时性的需求越来越迫切,因此需要实时数仓来满足这些需求。传统的离线数仓的数据时效性通常为 T+1,并且调度频率以天为单位,无法支持实时场景的数据需求。即使将调度频率设置为每小时,也仅能解决部分时效性要求较低的场景,对于时效性要求较高的场景仍然无法优雅地支撑。因此,实时数据使用的问题必须得到有效解决。实时数仓主要用于解决传统数仓数据时效性较低的问题,通常会用于实时的 OLAP 分析、实时数据看板、业务指标实时监控等场景。
携程技术
2023/02/28
1.2K0
干货 | 携程酒店实时数仓架构和案例
干货 | 上百个业务场景,语义匹配技术在携程智能客服中的应用
随着AI技术在各个领域的广泛应用,人机交互技术愈发成熟。包括电商、银行、电信等在内的很多领域开始建设智能客服的交互能力,为客人提供智能化自助服务,同时为客服人员的工作提供智能辅助。携程集团依靠强大的客服团队为国内外旅行者的出行提供了优质的服务保障,持续提升智能客服的交互能力,提高客服人员的生产效率显得尤为重要。
携程技术
2021/12/31
1.3K0
干货 | 上百个业务场景,语义匹配技术在携程智能客服中的应用
干货 | 携程酒店DevOps测试实践
王幸福,携程酒店研发部高级测试经理,负责无线自动化测试相关工作。在测试框架和平台研发、移动测试、DevOps等领域有着丰富的经验。
携程技术
2019/12/31
8610
干货 | 携程酒店DevOps测试实践
推荐阅读
相关推荐
携程:机器学习在酒店服务领域的实践
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档