Loading [MathJax]/jax/element/mml/optable/BasicLatin.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >KDD'18「airbnb」房屋动态定价经典方法

KDD'18「airbnb」房屋动态定价经典方法

作者头像
秋枫学习笔记
发布于 2022-09-19 03:50:29
发布于 2022-09-19 03:50:29
8150
举报
文章被收录于专栏:秋枫学习笔记秋枫学习笔记

背景

本文是以airbnb为背景,设计的房屋动态定价方法。本文采用两阶段的方式对定价进行预测,总体方案流程和上一篇文章中APP-LM有点类似,但是细节上也有差别。本文为kdd'18的论文,上一篇为kdd'19的论文,上一篇论文也就更进一步的提出了端到端的方法,如果没看过上一篇的可以看一下上一篇,因为关于损失函数中的一些含义介绍有所省略,因为在前一篇介绍过了。

上一篇:推荐系统(十四)——kdd'19动态定价方法(APP-LM,APP-DES,DNN-CL)

本文所提模型主要包括三个部分:

  • 一个二分类模型,用于预测房屋被预定的概率
  • 一个回归模型,用于结合各种特征以及定制的损失函数进行定价预测
  • 一个辅助个性化的模块,和回归模型结合预测更好的价格

可以发现这里的前两部分其实和APP-LM有点相似。

难点

需求估计难点

  • 需求预估:通常做动态定价时,使得P*F(P)最大的P就是所求定价,F(P)为需求函数。其实这里的需求函数就是对应的二分类模型,他的好坏影响着最终结果。但是文中场景中的房屋都是异质的,不能直接作出需求曲线,因此采用机器学习的方法结合其他特征进行学习得到。
  • 时间变化:房屋的预定会随着时间有季节性的变化,并且随着一些特殊事件的发生也会引起房屋预定的较大变化。
  • 供给变化:不像旅馆,所有房屋都是差不多的,是同质的,airbnb上的房屋是异质的,周围环境等因素都不一样,因此需要考虑在内。并且评分,周围房源也都要考虑进去。

定价难点

算法提供的动态定价建议只会被一部分商家接受,其他商家仍然会按照自己的想法来定价,并且他们的定价会偏高。因此,通过这些数据预测出来的价格可能会超出原始设定的价格范围。(PS:正如上一篇文章所述,虽然是动态定价,但是为了防止定价过高过低,会有一个固定的范围限制)

方法

定价的总体流程如上图所示,先预测预定概率,然后采用定价策略模型进行定价,然后进行个性化。

预定概率预测模型

该二分类模型文中采用了GBM模型(当然想上一篇文章的DNN等模型也可以尝试),使用了房屋的本身特征(可住几人,房间类型等)、时间特征(季节性、距离晚上的时间等)、辅助特征(房屋周围环境,搜索率等)。这些特征是在airbnb场景下用到的,可以参考,不过具体问题还是具体分析,这里就不过多陈述了。

除了设计模型之外,本文还在采样上进行了改进,文中说的是房屋密度高的地方有地理优势,因此在高密度的地方采样率也高。

想要得到精确的价格-需求曲线是很难的,主要存在以下挑战:数据稀疏、样本的唯一性、部分特征之间存在依赖关系。因此本文采用将预测的概率作为价格预测模型的输入的一部分。

定价策略模型

训练数据

{xi,yi}Ni=1

中N表示样本数,xi是特征,yi表示是否预定,是标签。

上式为总体的损失函数,+表示max(0,·),上图为损失函数对应的上下界的直线。虽然无法预测到准确的价格用于构建损失函数,但是可以有一个范围。上下界的函数如下所示

这里的上下界函数可以发现和上一篇文章的是类似的,因此这里不再过多赘述他们表达的含义,有需要的小伙伴可以看一下上一篇中的这部分内容,也可以结合上一篇文章中的表格一起看,会更加容易理解。其实就是要让价格在一个范围内,大于或小于都会产生损失。定价模型基于以下三个假设:

  • 对于同一个房子,建议价格与当前价格的预订概率呈正相关。预定概率高的可以涨点价
  • 动态定价的价格以房东通常设定的最具代表性的价格为中心,具有可学习的增加/减少幅度,因此这里说明模型预测的价格是基于原有价格的。
  • 预订概率模型未完全捕获的其他需求信号,应该将这些信号融入模型中

定价模型为:

P是calendar price(可以用多种方式定义,例如历史价格的均值等),q是预测概率,D是额外的需求信号得到的需求分数(例如相似的房屋聚类为一个簇)。

控制价格的涨跌,

当建议价格与实际价格相同时,以适当调节当参数。这两个参数保证

是单调的,随着概率的增大而增大。

通过将簇级别的需求信号调整到常见的高斯尺度上,将需求分数 D 归一化。D 的值越高,对应集群中的需求就越高。

,这两个参数控制曲线的弯度。如图所示,价格增加和下跌的曲线是不一样的,非对称曲线。通过这种方式,建议的价格可以更好的反应需求敏感度。

训练方式和参数设置等就不在这展开了。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-10-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 秋枫学习笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
推荐系统(十四)——kdd'19动态定价方法(APP-LM,APP-DES,DNN-CL)
本文以航空服务为场景,设计了一系列动态定价方法,对于其他场景具有借鉴意义。
秋枫学习笔记
2022/09/19
1.2K0
SIGIR'22「谷歌」BISER:双边无偏学习对有偏隐式反馈进行纠偏
推荐系统中通常采用隐式反馈(如点击)来构建模型,而观察到的反馈代表用户的点击日志,所以观察到的点击与真实用户意图之间时存在差异的,并且观察到的反馈通常偏向于热门商品,从而高估了热门商品的实际相关性。尽管现有研究已经开发出使用逆倾向加权 (IPW) 或因果推理的无偏学习方法,但它们只专注于消除商品的流行度偏差。本文提出了一种新颖的无偏推荐学习模型BISER,以消除推荐模型引起的商品曝光偏差。BISER 由两个关键组成部分组成:
秋枫学习笔记
2022/09/19
7780
案例 | 解密Airbnb的定价算法
对于计划出租房屋的房主,你应该将房屋的租金设定为多少呢?或者对于租房的顾客而言,应该给自己的租房支付多少呢?不管是对于一次有计划的远足,还是一次说走就走的旅行,为租房付出多少才真正合适呢? 回答这些问题并不容易。事实上,可以通过将潜在的租房列在我们网站— Airbnb 上来实现,Airbnb是一家联系旅游人士和家有空房出租的房主的服务型网站,它可以为用户提供各式各样的住宿信息。 在焦点小组,我们观察到人们在我们的网站上填写房屋信息的过程中,往往在价格选项上会显得为难。很多人会查看他们的邻居们所设置的价码,然
CDA数据分析师
2018/02/08
2.3K0
案例 | 解密Airbnb的定价算法
信息论 - 交叉熵
在信息论中,交叉熵(Cross Entropy)是表示两个概率分布p,q,其中p表示真实分布,q表示非真实分布,在相同的一组事件中,其中,用非真实分布q来表示某个事件发生所需要的平均比特数。。
为为为什么
2022/08/05
3640
011.线性回归算法推导
版权声明:本文为博主原创文章,允许转载,请标明出处。 https://blog.csdn.net/qwdafedv/article/details/82866099
qubianzhong
2018/10/10
8420
011.线性回归算法推导
WWW'22「快手」序列推荐:解耦长短期兴趣
4. 最后由于长期和短期兴趣的重要性是动态变化的,通过基于注意力的网络自适应地聚合它们进行预测。
秋枫学习笔记
2022/09/19
8710
逻辑回归
y=\sigma(f(\boldsymbol{x}))=\sigma\left(\boldsymbol{w}^{T} \boldsymbol{x}\right)=\frac{1}{1+e^{-\boldsymbol{w}^{T} \boldsymbol{x}}}
故事尾音
2019/12/18
6330
逻辑回归
简单易学的机器学习算法——Latent Dirichlet Allocation(理论篇)
LDA(Latent Dirichlet Allocation)称为潜在狄利克雷分布,是文本语义分析中比较重要的一个模型,同时,LDA模型中使用到了贝叶斯思维的一些知识,这些知识是统计机器学习的基础。为了能够对LDA原理有清晰的认识,也为了能够对贝叶斯思维有全面的了解,在这里对基本知识以及LDA的相关知识进行阐述,本系列包括两个部分:
felixzhao
2019/01/31
7040
简单易学的机器学习算法——Latent Dirichlet Allocation(理论篇)
SIGIR'22「eBay」MP2:动量对比框架缓解推荐系统中的标注偏差
现有的推荐系统模型训练通常采用point wise(如交叉熵)或pair wise损失(如BPR),但是标签的有限的表达能力可能无法适应不同程度的用户偏好,从而导致模型训练期间的冲突,作者称之为标注偏差(annotation bias)。
秋枫学习笔记
2022/09/19
5270
WWW'22「华为」CPR Loss:交叉成对排序损失对推荐系统纠偏
通常推荐系统在观察到的交互数据上优化模型,这受之前的曝光机制的影响,会存在许多偏差,如流行度偏差。本文提出了一种新的学习范式,称为交叉成对排名(CPR),在不知道曝光机制的情况下实现无偏见的推荐。对多个观察到的交互进行一次采样,并将它们的预测的组合来构成损失。
秋枫学习笔记
2022/09/19
4210
KDD'22「Salesforce」基于向量化的无偏排序学习
无偏的排序学习(ULTR)是从有偏的用户点击日志中训练一个无偏的排序模型。当前的大多数 ULTR 方法都是基于检验假设(examination hypothesis,EH),它假设点击概率可以分解为两个标量函数,一个与排序特征有关,另一个与偏差因素有关。特征、偏差因子和点击之间的相互作用在实践中很复杂,通常不能以这种独立的方式分解。
秋枫学习笔记
2022/09/19
7690
AAAI'22「腾讯」多任务推荐系统中的跨任务知识蒸馏
多任务学习被广泛应用于推荐系统,先前的工作专注于设计底部层的结构来共享输入数据的信息,但是由于它们采用特定任务的二分类标签作为训练的监督信号,因此关于如何准确排序商品的知识并未在任务之间完全共享。
秋枫学习笔记
2022/09/19
4710
因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)
反事实预测应该是一个非常有意思的话题,笔者也是由一篇盒马的文章出发,对这个模块先行进行简答的学习。主要参考: KDD2021论文推荐:盒马-融合反事实预测与MDP模型的清滞销定价算法 Markdowns-in-E-Commerce-Fresh-Retail-A-Counterfactual-Prediction-and-Multi-Period-Optimization-Approach
悟乙己
2022/01/21
3.5K0
因果推断与反事实预测——盒马KDD2021的一篇论文(二十三)
图解机器学习 | 逻辑回归算法详解
教程地址:http://www.showmeai.tech/tutorials/34
ShowMeAI
2022/03/10
9900
图解机器学习 | 逻辑回归算法详解
深度学习应用篇-元学习[16]:基于模型的元学习-Learning to Learn优化策略、Meta-Learner LSTM
Learning to Learn by Gradient Descent by Gradient Descent 提出了一种全新的优化策略, 用 LSTM 替代传统优化方法学习一个针对特定任务的优化器。
汀丶人工智能
2023/10/11
9840
深度学习应用篇-元学习[16]:基于模型的元学习-Learning to Learn优化策略、Meta-Learner LSTM
Logistic Regression
**二项逻辑斯谛回归模型(binomial logistic regression model)**是一种分类模型,并且还是一种二类分类模型。 来源于 Logistic 分布 。
为为为什么
2023/10/17
3290
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
基于LiDAR的感知系统对于自动驾驶汽车[20]或移动机器人[41]的安全导航至关重要。一个关键挑战是在车辆环境中对物体进行可靠检测和分类[54]。最先进的(SOTA)三维目标检测方法在很大程度上依赖于用于训练的数据集的质量和多样性,同时也取决于这些数据集在推理过程中如何真实地反映现实世界条件。获取和标注此类数据仍然是一项重大的技术和实践挑战,既耗时又劳动密集。这在三维目标检测模型的大规模开发和部署中构成了一个主要障碍。
集智书童公众号
2024/05/10
8440
UADA3D 突破激光雷达难题 | 引领无监督域自适应新趋势,助力点云三维目标检测突破!
深度学习应用篇-元学习[15]:基于度量的元学习:SNAIL、RN、PN、MN
元学习可以被定义为一种序列到序列的问题, 在现存的方法中,元学习器的瓶颈是如何去吸收同化利用过去的经验。 注意力机制可以允许在历史中精准摘取某段具体的信息。
汀丶人工智能
2023/10/11
7960
深度学习应用篇-元学习[15]:基于度量的元学习:SNAIL、RN、PN、MN
机器学习:线性回归
如图表示一个房价预测的数据集,x轴表示房子的面积,y轴表示对应的房价,现在需要做的就是用一条直线拟合这些数据,使得给出一个新的房子面积,可以预测出它的房价。当然,可以用曲线来拟合数据使得预测更加准确,但是目前只先讨论单变量的线性回归,即用直线来拟合数据。
Here_SDUT
2022/09/19
5270
机器学习:线性回归
WSDM'22「百度」考虑行为多样性的对比元学习
本文希望通过结合多种类型的行为(访问页面,喜欢,购买等),从而发掘用户和商品之间的复杂关联。但是这类方法通常面临两个问题:
秋枫学习笔记
2022/09/19
3240
推荐阅读
相关推荐
推荐系统(十四)——kdd'19动态定价方法(APP-LM,APP-DES,DNN-CL)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档