Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >机器学习在美团配送系统的实践:用技术还原真实世界-笔记

机器学习在美团配送系统的实践:用技术还原真实世界-笔记

作者头像
Tyan
发布于 2022-06-12 09:14:19
发布于 2022-06-12 09:14:19
7950
举报
文章被收录于专栏:SnailTyanSnailTyan

文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书

本文为美团文章学习的笔记整理。

1. 美团“超脑”配送系统的由来

美团内部把配送的AI系统,简称为“超脑”配送系统。

2. 即时配送在全球快速发展

以外卖为依托,即时配送业务在全球范围内掀起了一波快速发展的浪潮,两个问题:

  • “懒”是人类的天性。平价、方便、快捷的服务是人类的普遍需求,尤其是在“吃”这个事情上,外卖成为了一种高频的刚需。
  • 外卖的商业模式完全可行。以美团外卖为例,2018年上半年整体收入160亿,同步增长90%。根据Uber公布的数据,Uber Eats在2018第一季度占整体营业的13%。

3. 即时配送的业务模型

即时配送,是一种配送时长1小时以内,平均配送时长约30分钟的快速配送业务。如此快速的配送时效,将传统的线上电商交易与线下物流配送(传统划分比较明确的两条业务)整合为统一整体,形成了用户、商户、骑手和平台互相交错的四元关系。

以外卖搜索和排序为例,在下午时段,在用户搜索和推荐中可以看到更多的商家,因为此时运力充分,可以提供更远距离的配送服务,不仅能更好满足用户的需求,提高商家的单量,而且能够增加骑手的收入。

即时配送的核心指标是效率、成本、体验,这三者也形成了即时配送的商业模型。简单来说可以分为以下几步:

首先配送效率提升,让骑手在单位时间内配送更多订单,产生更多价值。然后配送成本下降,更高的效率,一方面让骑手收入增加,一方面也让订单平均成本下降。然后用户体验提升,低成本能够让用户(商户)以更低的价格享受更好的配送服务,从而保证更好的用户体验。进一步提升效率并形成循环,更好的用户体验,让更多用户(商户)聚集过来,提升规模和密度,进一步提升配送效率。

4. 美团“超脑”配送系统

美团“超脑”配送系统,包含以下几个方面:

  • 大数据处理和计算能力
    • 算法数据和计算平台:包括实时特征计算、离线数据处理、机器学习平台等。
  • 建立对世界深度感知
    • LBS系统:提供正确位置(用户/商户/骑手)以及两点之间正确的骑行导航。
    • 多传感器:提供室内定位以、精细化场景刻画、骑手运动状态识别
  • 正确理解和准确预测
    • 时间预估:提供所有配送环节时间的准确预估
    • 其他预估:销量预估、运力预估等
  • 完成复杂决策
    • 调度系统:多人多点实时调度系统,完成派单决策:谁来送?怎么送?
    • 定价系统:实时动态定价系统,完成定价决策:用户收多少钱?给骑手多少钱?
    • 规划系统:配送网络规划系统,完成规划决策:站点如何划分?运力如何运营?

5. 机器学习技术挑战

如何构建一个在真实物理世界运行的AI系统,是最大的挑战。具体到机器学习方向而言,挑战包括以下几个方面:

  • 精度足够高、粒度足够细
    • 时间要求:一方面是周期性变化,比如早午晚,工作假日,季节变化;一方面是分钟级的精细度,比如一个商圈单量和运力的实时变化。
    • 空间要求:一方面是不同商圈独有特性,比如CBD区域;一方面是要实现楼栋和楼层的精度,比如1楼和20楼,就是完全不同的配送难度。
    • 鲁棒性要求:处理各种不确定的能力,比如天气变化、交通变化等等。
  • 线下数据质量的巨大挑战
    • 大噪音:比如GPS定位漂移,尤其是在高楼附近,更不要说在室内GPS基本不可用。
    • 不完备:比如商家后厨数据、堂食数据、其他平台数据,都极难获得。
    • 高复杂:配送场景多样而且不稳定,随着时间、天气、路况等在不断变化。

6. 配送系统的核心参数ETA

ETA(Estimated Time of Arrival,时间送达预估)是配送系统中非常重要参数,与用户体验、配送成本有直接关系,而且会直接影响调度系统和定价系统的最终决策。

通过机器学习方法,将外卖配送几乎所有环节都进行了精准预估预测。

Note: ETA关联了调度系统与定价系统,对所有时间环节都进行预测。

7. 精准到楼宇和楼层的预估:交付时长

交付时长是指骑手到达用户后,将外卖交付到用户手中并离开的时间,实际是需要考虑三维空间内计算(上楼-下楼)。交付时间精准预估,有两点重要的意义,首先是客观的衡量配送难度,给骑手合理补贴;其次,考虑对骑手身上后续订单的影响,防止调度不合理,导致其他订单超时。

交付时长的目标是,做到楼宇和楼层的精准颗粒度,具体可以拆解为以下几步:

  1. 地址的精准解析(精确到楼宇/单元/楼层)
    • 地址精度需要在5级之上(4级:街道,5级:楼宇),国内拥有这个级别精细化数据的公司屈指可数。
    • 数据的安全级别很高,我们做了很多脱敏工作,做了各种数据保护与隔离,保证用户隐私和数据安全
    • 地址信息的多种表达方式、各种变形,需要较强的NLU技术能力。
  2. 交付时长预估
    • 通过骑手轨迹进行“入客-离客”识别,并进行大量数据清洗工作。
    • 统计各个粒度的交付时长,通过树形模型实现快速搜索各个粒度的数据。
    • 因为预估精度是楼宇和楼层,数据很稀疏,很难直接进行统计,需要通过各种数据平滑和回归预估,处理数据稀疏和平滑的问题。
  3. 下游业务应用
    • 给调度和定价业务,提供楼宇+楼层维度的交付时长。从上图可以看到,在不同楼宇,不同楼层交付时长的区分度还是很明显的。
    • 尤其是楼层与交付时长并不是线性相关,还具体调研过骑手决策行为,发现骑手会考虑等电梯的时间,低楼层骑手倾向于走楼梯,高楼层则坐电梯。

Note: 交付时长是一个特别精细的工作,从美团的文章来看,交付时长非常重要,还有一篇单独的文章来介绍这个工作。

8. 配送中最重要的数据之一:地图

配送地图的目标可以概括为以下两点:

  • 正确的位置
    • 实时部分:骑手实时位置。
    • 静态部分:用户和商户准确的地址和位置。
  • 正确的导航
    • 两点之间正确的距离和路线。
    • 突发情况的快速反应(封路、限行)。

在即时配送业务中,骑行地图的重要性非常之高,同时很多问题确实非常具有行业特色,通过驾车地图的技术无法很有效的解决。

Note: 地图是一个非常庞大的业务,需要有充足的资源再考虑。

9. 基于签到数据的位置校正:交付点

目前主要问题:用户位置信息有很多错误,比如:

  • 用户选择错误,在订单发送到配送系统的时候,需要做一次用户坐标纠正,引导骑手到达正确的位置。
  • POI数据不精细,用户选择了比较粗的位置信息。现实中在一个小区里面,找到一个具体xx栋楼还是非常困难的。造成这种原因,一方面可能是用户选择不精细,还有一种可能,就是地图上没有具体楼栋的POI信息。

在实际配送中,会要求骑手在完成交付后进行签到,这样就会积累大量的上报数据,对于后续进行精细化挖掘非常有帮助。这其中蕴含着极高的价值,具体来说有三方面:

  • 数据量大
    • 每天几千万订单,几十亿的轨迹数据。
    • 可以充分覆盖每一个小区/楼栋/单元门。
  • 维度多样
    • 除了骑手签到和轨迹数据,我们还有大量的用户、商户和地图数据。
    • 多种数据维度可以交叉验证,有效避免数据的噪音,提高挖掘结果精度。
  • 数据完备
    • 在局部(用户和商户)数据足够稠密,置信度比较高。

Note: 要求骑手完成订单签到是一种非常棒的操作,可以收集完整的订单信息(订单完成时间),修正用户位置。

10. 交付点挖掘的技术实战:挑战

数据挖掘实际过程中,整个挖掘过程,分为以下几个步骤:(1)基于地址分组;(2)数据去噪;(3)数据聚合;(4)置信度打分。其中主要技术挑战,主要在各种场景中保证数据挖掘质量和覆盖率,具体来说主要有三个挑战:

  • 数据去噪
    • 数据噪音来源比较多样,包括GPS的漂移、骑手误操作、违规操作等各种。一方面是针对噪音原因进行特殊处理(比如一些作弊行为),另一方面要充分发挥数据密度和数据量的优势,在保证尽量去除Outlier后,依然保持可观的数据量。能够同时使用其他维度的数据进行验证,也是非常重要的,甚至可以说数据多样性和正交性,决定了我们能做事情的上限。
  • 数据聚合
    • 不同区域的楼宇密度完全不一样,具有极强的Local属性,使用常规聚类方法,比较难做到参数统一,需要找到一种不过分依赖样本集合大小,以及对去噪不敏感的聚类算法。
  • 重名问题
    • 这个属于POI融合的一个子问题,判断两个POI信息是否应该合并。这个在用户地址中比较常见,用户提供的地址信息一样,但实际是两个地方。这种情况下,我们的处理原则是一方面要求纠正后坐标更符合骑手签到情况,另一方面新坐标的签到数据要足够稠密。

交付点挖掘的技术实战:效果

目前效果上看还是非常明显的。包括几个方面:

  • 骑手交付距离明显降低
  • 单元门级别的高精度位置
  • 目前的问题以及后续的优化点 如何提升其作为POI挖掘和发现手段的准确率?这里面有很多优化点,比如去重(交付点-位置信息的一一映射),POI信息补全和更新。 如何扩大数据渠道并做到信息整合?目前主要渠道还是骑手签到和轨迹数据,这个明显有更大的想象空间,毕竟每天在全国大街小巷,有几十万骑手在进行配送,除了前面(以及后面)提到的通过手机被动采集的数据,让骑手主动采集数据,也是不错的建设思路。只不过想要做好的话,需要建立一个相对闭环数据系统,包括上报、采集、清洗、加工、监控等等。

Note: 这是一个很精细的工作,初期不太用考虑。

11. 更精细化的配送场景识别:感知

地图技术,只能解决在室外场景的位置和导航问题。但配送在商家侧(到店、取餐)和用户侧(到客、交付)两个场景中,其实是发生在室内环境。在室内的骑手位置是在哪里、在做什么以及用户和商家在做什么,如果了解这些,就能解决很多实际问题。

“情景感知”具体方向:

情景感知的目标就是做到场景的精细刻画(上图的上半部分),包含两个方面工作:

  1. 配送节点的精确刻画 在ETA预估中已经展示过一些,不过之前主要还是基于骑手上报数据,这显然无法做到很高精确,必须引入更客观的数据进行描述。目前,我们选择的是WIFI和蓝牙的地理围栏技术作为主要辅助。
  2. 配送过程的精确刻画 骑手在配送过程中经常会切换方式,比如可能某个小区不让骑电动车,那骑手必须步行,再比如骑手在商家发生长时间驻留,那应该是发生了等餐的情况(用户侧同理)。目前,选择使用基于传感器的运动状态识别作为主要辅助。

Note: 这是属于一个锦上添花的功能,初期不太用考虑。

Reference

  1. 机器学习在美团配送系统的实践:用技术还原真实世界
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-06-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
机器学习在美团配送系统的实践:用技术还原真实世界
本文重点解读美团在即时配送领域机器学习技术的最新进展,构建对线下真实世界各种场景的感知能力,还原并预测配送过程各个细节。
美团技术团队
2019/01/07
6590
机器学习在美团配送系统的实践:用技术还原真实世界
2014年,斯嘉丽·约翰逊主演的科幻片《超体》大火,影片中主人公Lucy由于无意中摄入了大量的代号为“CPH4”的神秘药物,大脑神经元获得空前的开发,获得了异乎寻常的超能力,她能够对这个世界进行全新的感知、理解和控制(比如控制无线电波),最终跨越时间和空间成为了一个超级个体。
美团技术团队
2018/12/14
8540
机器学习在美团配送系统的实践:用技术还原真实世界
美团智能配送系统的运筹优化实战-笔记
文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书
Tyan
2022/06/12
1.9K0
美团智能配送系统的运筹优化实战-笔记
专访美团点评 AI 技术团队负责人何仁清:全球规模最大的智能配送调度系统是如何建成的
AI 研习社按:互联网影响着社会的方方面面,作为 O2O 和共享经济的代表,美团外卖经过几年高速发展,以每天配送超过千万份订单、几十万骑手的规模,成为世界上最大的配送平台。实际上,看上去劳动密集型的外卖行业,其实背后蕴藏着大数据、云计算、物联网、人工智能等高新技术,是这些高科技,使美团外卖能够在激烈竞争中逐渐脱颖而出。
AI研习社
2018/07/26
2.4K0
专访美团点评 AI 技术团队负责人何仁清:全球规模最大的智能配送调度系统是如何建成的
美团智能配送系统的运筹优化实战
美团配送业务场景复杂,单量规模大。下图这组数字是2019年5月美团配送品牌发布时的数据。
物流IT圈
2020/02/26
2.1K0
美团智能配送系统的运筹优化实战
业界 | 每天1800万单,1小时送到,美团外卖如何优化配送模型?
大数据文摘作品 在4月13号刚结束的O'Reilly和Intel AI Conference上,美团点评的配送算法策略架构师郝井华博士详细介绍了美团外卖即时配送业务的重难点,让我们来看看大数据文摘整理的演讲精华。 郝井华,美团点评研究员 美团外卖是全球最大的外卖平台,以及全球最大的即时配送平台。其共有骑手60万,签约商家150万,每天配送外卖1800万单。 美团要做的是即时配送,也就是在一个小时之内把订单送到客户手中。那么配送模式是如何配置的呢?60万骑手如何能够高效率低成本地工作? 优化配送模式 后台是把
大数据文摘
2018/05/23
1.2K0
美团配送系统架构演进实践
美团配送自成立以来,业务经历了多次跨越式的发展。业务的飞速增长,对系统的整体架构和基础设施提出了越来越高的要求,同时也不断驱动着技术团队深刻理解业务、准确定位领域模型、高效支撑系统扩展。如何在业务高速增长、可用性越来越高的背景下实现系统架构的快速有效升级?如何保证复杂业务下的研发效率与质量?本文将为大家介绍美团配送的一些思考与实践。
美团技术团队
2019/03/22
1.7K0
美团配送系统架构演进实践
即时配送的订单分配策略:从建模和优化-笔记
文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书
Tyan
2022/06/12
1.9K0
即时配送的订单分配策略:从建模和优化-笔记
美团外卖骑手背后的AI技术
总第235篇 2018年 第27篇 随着数字化时代的到来,外卖市场近年来发展非常迅猛。对外卖物流系统而言,配送效率和用户体验至关重要。而实际配送过程是由配送员(骑手)最终完成的,因此,想要真正提升配送效率,不但要在智能调度系统(订单指派、路径规划、ETA)上下功夫,还要不断提升配送员的“附加”能力,让他们越送越“熟”,越送越“顺”,越送越“快”。以此为出发点,美团点评研发团队设计了骑手智能助手,全面提升骑手的各方面能力。 在 1月份的 AICon全球人工智能与机器学习技术大会上,美团点评配送人工智能方向负
美团技术团队
2018/06/07
2.1K3
【沙龙干货】主题三:美团配送智能调度实践
分享内容 ---- 外卖从2013、2014年开始到现在,最近两到三年发展速度非常快,在快速发展过程里边涌现了很多很有难度很新的问题,这个里边订单的调度是比较有难度,也是比较有代表性的一个问题,希望通过今天的分享能让大家对外卖的订单调度问题以及我们的工作有一个比较深入的认识。 美团外卖从2015年初开始决定做配送,从最开始的一到两万单,已经发展到现在的将近300万单,目前需要十万以上的骑手,这个规模相当大。随之而来的一个问题——成本相对比较高,占到整个配送运营80%以上的成本,怎么样让我们的骑手工作效率高,
美团技术团队
2018/03/12
2.3K0
【沙龙干货】主题三:美团配送智能调度实践
即时配送的ETA问题之亿级样本特征构造实践-笔记
文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书
Tyan
2022/08/11
8020
即时配送的ETA问题之亿级样本特征构造实践-笔记
深度学习在美团配送ETA预估中的探索与实践-笔记
文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书
Tyan
2022/08/11
7860
深度学习在美团配送ETA预估中的探索与实践-笔记
美团、达达:即时配送掀起智能化竞速赛
受疫情影响,消费者线上消费行为渗透率逐渐提升,即时配送服务的需求不断增多。再加上非餐需求的持续上升,即时配送覆盖场景进一步扩大,消费者依赖度再度提升。面对市场规模不断增大的即时配送领域,各路玩家纷纷来此布局试图分走一杯羹。
用户6132544
2022/04/24
5670
美团配送实时特征平台建设实践
导读:2019年5月,美团正式推出新品牌「美团配送」,升级配送开放平台。那你知道支撑美团配送大脑的实时特征平台是如何建设的吗?如何实现每分钟生产千万级的实时特征?如何在70w+QPS的场景下实现4个9响应耗时在50毫秒的需求?本文将为大家介绍配送实时特征平台的发展历程,关键技术和实践经验。
Houye
2021/01/27
1.5K0
美团配送实时特征平台建设实践
美团20年度财报解读:变现仍不是重点
作为长期跟踪研究美团的业内专家之一,有必要在美团成立十年后的首份财报基础上,对美团曾经的价值和将产生的新价值做一番深入的分析,借此判断美团未来的增长预期。
庄帅
2021/03/30
4220
美团20年度财报解读:变现仍不是重点
美团配送交付时间轻量级预估实践
在本文中,我们介绍了交付时间预估迭代的三个版本,分别为基于地址结构的树模型、向量召回方案以及轻量级的End-to-End的深度学习网络。同时介绍了如何在性能和指标之间取舍,以及模型策略迭代的中间历程,希望能给从事相关工作的同学们有所启发和帮助。
数据猿
2019/10/15
1K0
美团配送交付时间轻量级预估实践
深度学习在美团配送ETA预估中的探索与实践
美美导读:ETA(预计送达时间预估)是配送调度环节中非常重要的一环,而且涉及的因素特别多。本文阐述了ETA深度学习技术迭代中的一些尝试及效果。
美团技术团队
2019/03/21
1.1K0
深度学习在美团配送ETA预估中的探索与实践
配送交付时间轻量级预估实践
在本文中,我们介绍了交付时间预估迭代的三个版本,分别为基于地址结构的树模型、向量召回方案以及轻量级的End-to-End的深度学习网络。同时介绍了如何在性能和指标之间取舍,以及模型策略迭代的中间历程,希望能给从事相关工作的同学们有所启发和帮助。
美团技术团队
2019/10/12
7480
配送交付时间轻量级预估实践
配送交付时间轻量级预估实践-笔记
文章作者:Tyan 博客:noahsnail.com  |  CSDN  |  简书
Tyan
2022/06/12
6450
配送交付时间轻量级预估实践-笔记
历史转折中的美团,AI进化新范式
最近一季营收190亿元,第一大收入源外卖业务,贡献111.72亿元,占比59%,是这家中国第四大互联网公司直接实力所在。
量子位
2018/12/26
6710
推荐阅读
相关推荐
机器学习在美团配送系统的实践:用技术还原真实世界
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档