Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >实战案例 | 美团如何用NLP完成5大应用场景

实战案例 | 美团如何用NLP完成5大应用场景

作者头像
AI科技大本营
发布于 2018-04-26 02:17:46
发布于 2018-04-26 02:17:46
3.8K0
举报

王兴在最近一篇刷屏的专访当中说,“很多人只关心边界,不关心核心”。这话放在人工智能领域当中也适用,今天很多人关心人工智能的前沿论文,但是对于它如何在企业业务中发挥实际作用,反而并不关注。每一项技术,如果没有用好,那算不得好技术。那么王兴所执掌的美团,到底是如何用AI服务核心业务呢?NLP技术到底在美团有怎样的具体案例? 本文来自美团技术大牛李彪在最近一次闭门沙龙分享,介绍 NLP 技术的应用场景、技术实现和具体案例,没有炫技,只有满满的干货。Enjoy!

作者 | 李彪 美团智能技术中心

编辑 | 波波,鸽子

针对NLP技术,大神们刚刚展开过比较激烈的讨论——Yann Lecun论战Yova Goldberg,导火索是是一篇“对抗式生成自然语言的论文”。

NLP大神Yova Goldberg认为该论文所生成的“自然语言”和真实语言相差太远,充满语法错误,随后他直接把战斗升级成语言学家大战计算机科学家:“摆脱你们这帮搞深度学习的人,别再抓着语言不放,并宣称自己已经解决好语言的问题了。”“语言对我来说很神圣。”

对此,深度学习大神Yann Lecun自是有所不满:“这话竟然是出自Yova之口?他自己都在拿深度学习来做NLP研究!”其实,深度学习已在很多领域都有应用,迟早会渗透到NLP的。

这里我们不深究大神们谁对谁错,但从他们的争论中,我们至少能得出两点:首先是深度学习在很多方面得到了应用,事实上在NLP的各个领域,深度学习都有应用,其中比较成功的就有机器翻译。反过来,Yova Goldberg的表述,在我们看来也是有道理的,现在就认定深度学习能解决各种各样的问题确实说得太满了,有一些自认为是人工智能专家的人,其实还远远达不到这一水准。

我今天的主题是围绕NLP来展开的,其实它跟图像、语音这类智能感知领域不太一样,难点非常多,也是人类几千年的一些智慧或者文化的沉淀。

我的分享分为三个部分,主要是想介绍:

  • NLP在美团有哪一些应用场景
  • NLP在美团点评应用了哪一些技术
  • 重点是NLP在美团点评的一些案例

我会选取几个比较有典型的案例给大家详细介绍一下,最后就是简单的总结。

NLP在美团点评的应用场景

第一个场景,其实是在美团点评的APP上面,每天都有非常大量的用户词。这个里面有一个文本,我们可以理解成是用户的一些需求,从中可以做块状分析,统一性分析等等。这对我们的搜索系统性能的提升有很大的帮助。

还有一部分文本,是商家的标题及详情页里面很多东西:比如地址、菜品等等。这也是我们比较关心的文本方面的一些东西,我们可以对它的品类做一些很好的识别。

第二个场景,大家应该看得出来,美团点评有着非常巨大的UGC数据,就是用户对商家的评论。这个数据能带来什么?比如说我们可以索取Tag,在用户做决策的时候提供信息帮助。还可以对评论做一些分类,大家现在看到的是比较优质的一些评论分类,事实上我们在后面做的时候,需要对分类做大量的工作,比如垃圾、黄反、优质等的识别。

除此之外,还要对评论做一些情感分析,比如说评价是正向、负向还是中性的等等。

另外,还有一部分是美团点评APP的一些新闻,比如标题的宣传、内容的理解、信息的抽取、POI的识别,等等。还有很多工作,比如整篇文章的分类,是分成美食还是影视等类别,其实也要用到NLP技术。

这几大类是大家能直观感受到的,其实还有非常多大家感受不到的,例如客服规划的内容,其实也是NLP需要考虑的。还有就是Crash日志,以及后台商家需要用到NLP的技术。

NLP在美团点评的应用技术

回头来看,刚才提到了NLP的一些使用场景,那NLP具体研究的是什么呢?

“NLP(自然语言处理)可以定义为研究在人与人交际中以及在人与机器交际中的语言问题的一门学科。”

人和机器交互比较好理解,比如说百度搜索、美团APP搜索,这就是人和机器通过搜索关键词进行交互,比如说对话系统,做一些问答或聊天,这个也指人与机器在语音上的交互。

人和人交际可能不那么好理解,就是借助于机器设备人和人的交际。我说几个例子:比如说输入法,用户通过输入法输入想要的东西,然后再反过来用输入法去做,这里面要用到非常多的NLP技术;还有你去国外旅游,可以用APP实时翻译语音,然后跟外地人进行一次很好的沟通,这也是人和人之间的交流,会借助于设备,这就要用到很多NLP技术,这里可能比较抽象。

下面我就列一下,我所接触到的NLP研究内容,其实还有很多我没接触到的。

具体来说,是词法短语方面的分词、词性标注、命名实体识别、组块分析等,还有句法语义、篇章理解、系统应用等,这些都属于NLP研究的一些点。

NLP有一个特点,就是很多技术不容易成为技术或产品,比如知识图谱或信息检索。还有像对话、机器翻译这些,其实都是独立的NLP应用场景与系统。另外,在语音识别合成、OCR图片方面也会用到NLP。

在感知方面,语音图像要更深层的理解它里面的内容,其实都离不开语言的表述。所以,未来的趋势就是NLP会和这些语境作越来越多的融合,也就是说它的应用场景会非常多。这些只是一些关键词,在美团,可能不需要把所有这些东西都研究一遍。

接着,说一下我们在美团所做的事情,主要是分三块来做NLP的一些研究工作:

最下层的NLP需要很多依赖,比如大量的标注数据,这是限制深度学习在NLP领域发展的重要一点。因为这种NLP需要大量的数据,这个可能需要有一些人(专门)来做。还有机器学习的一些算法和深度学习的一些算法方向,我们技术研发在这做了一套深度学习的框架。还会依赖于我们内部处理的一些平台,以及数据存储的一些基础,这是最基本的东西。

再往上就是NLP的一些基础技术,分成四个维度:句法就是整个分析和句法的,语意在已表示和匹配,篇章在文本分类方面做一些研究,这是一些基础的技术。

其实NLP还和应用系统做一些专门的研发或者独立产品,比如说对话、翻译、图谱等等。

NLP支持的业务场景非常多,如搜索、推荐、广告、配送客服之类。

上图标红的内容,我接下来会专门举例来讲,也就是我们做出来的案例,会具体到块状分析和评论分析、客服、语意表示和匹配的一些应用。

NLP在美团点评的应用案例

我们就进入第三部分案例。

先说一下Query分析。最下层词语,比如说搜索五道口附近的钢铁侠3,最上面就会做一些成分识别。

成分是根据业务制订的一些标准体系,比如说五道口是一个地址的核心词,附近其实是地址的修饰词,钢铁侠3其实是店的核心词,店可以理解成商家的产品,比如说电影院里面某一个电影。

再往下就是结构、主体和泛化可做的东西比较多,比如说做一些拓展,五道口可能有华联等等,这个现在是基于图谱来做的。

其实,这个用处非常多,比如说举个例子,就是望京华联搜这个可能出不来结果,但如果做一个扩展之后就可以很顺利的找到它想要的一些结果。

从图谱方面的一些东西可以很好的应用。从内容方面的话,比如说钢铁侠3有一些相似的电影等等,这个其实也是我们的一些泛化。

再往上会对Query做一些概念的识别,主要是电影。

以Query意图识别做为例子。说一个Query,我们对它的类别做一个判别,比如动物园门票就是旅游,全聚德和望京是美食。我们可以分成不同的类别,这些类别有美食、电影、酒店之类的,还有很多二三级的品类。

说到这个场景之后,其实大家脑子里就可以想到这个事情怎么来做。

Query意图识别可以转换成机器学习多分类的问题。机器学习对一个问题有一套标准的流程,做过机器学习的都知道。首先要对问题做一个分析,要分哪一些类别,根据现状制定一个目标。现有数据的支持是否有一些标注的辞典、数据等等,根据这个再来整理数据,比如说如果标注数据不够怎么办,后面会做一些介绍。特征工程需要抽取很多特征,特别是你要考虑到O2O的一些特点,需要做一些事情。特征做完之后再做模型方面的一些选择和分析,最后做一些线下的评估,然后在线上镶嵌看它的效果。这个流程是非常通用的。

摘出几点,有可能和其他地方不太一样的地方做一个介绍。首先就是训练样本怎么获取,这个其实比较难,第一种是人工标注,第二种就是自动标注。思路有几种,可以通过主动学习用模型学习,它的执行度比较高的,作为它已经有了,区分比较低的再来标一下,这样标注的样本量就非常多。还有Query的思想其实也是来扩充执行度比较高的样本作为它的标注数据。

第二个问题就是特征设计,我们会把Query的一些语义的特征,Query扩充的一些信息也会融进来。说一下不一样的,我们Query是有地域区分的,例如黄鹤楼,可能在北京搜更多的是一个酒店饭店;但如果在武汉搜的话,其实就是一个景点。模型尝试的话,(PPT图示)右边就是精准化简单的图,中间两层还做了文本分类的模型。

最后再说一下整体的流程。我们的分类目标就是定一些品类体系,用的话,可能就是在流量分发、统计到排序里面会用;现状有一些辞典的,解决思路其实就是想通过机器学习的方法来解决。数据准备刚才已经介绍了,特征工程也说了一下,最后用DN加很多点,在线上我们在旅游产品上线可以提升5%的水平。

案例2,其实刚才说的美团点评有很重要的数据就是评论。评论可做的事情非常多,比如说下面是我们需要分析的一些评论的数据,我们要做的一些图谱或者第三方数据抓取的一些数据。我们会对评论展开一些分析,比如说觉得电影不错,这个首先我们会对它做一个句子的切分做成一个短句,做成一个与各方面的区别。这个时候有一些区别对待,再来区别评论的主题,这个更多的在细密度的操作和对Tag方面的一些理解,包括Tag的抽取,Tag的聚类一些东西。再往下就是整个评论,比如说刚才说的一些评论,评论区的一些聚合,重点就挑评论摘要的分成做一个介绍。

在我们展示的商家里面,除了Tag之外,可以把用户评论里面的一些表述提取出来,辅助用户做一些决策。当然,这里面的话,不仅仅可以从评论数据来做,还可以从商家详情里面做一些表述,当然它的难点的话,就是摘要生成会遇到一些问题,具体怎么做呢?简单说一下,就是大概分成几个流程:首先对评论做语句切片,在线上展示的时候会有一定限制的。接着做一些情感分析,比如说识别出它的一些正向的评论,因为一般情况下,不会把负向的放里面,选取有代表性的句子,这个事情已经在我们推进的产品上面。

案例3,语义匹配模型。其实这个是用户非常多的,只要涉及到文本之间的匹配都会遇到这个问题。比如说Query和Query POI的相似度,比如说搜的是草莓蛋糕,需要和商家的标题做一些匹配;有一些输入的前缀做一些匹配,还会做一些Query的推进,比如说烤肉,这个是可以做到搜索广告等排序系统里面的。

这里分为四个阶段。从我的理解角度,标准化就是把一个文档分成稀疏的向量算出它的一些权重,匹配通过向量空间得到一个分值,当然矩阵分解也很明显,比如说同意方面的信息表述比较少,而且它的维度非常大。

如果把巨大的向量拼在一起就变成一个大矩阵,大矩阵我们是否能把这个维度降下来,然后再是引入语意方面的一些信息呢?实际上是可以的,把一个矩阵分成两个就可以得到它的一些解释,经典的是1990年左右做LSA方面的工作,存在一个问题就是同义词可以解决,但是多义词就没有办法了,而且得到矩阵的数值其实没有太多含义,范围比较大,这是在实际中不太好理解。

在2000年左右的时候,就相当于把LSA引入了多义词的分类。比如说一个文档有很多主题组成的,假设这个组成是符合一个多样式的分布,主题会有很多词组成,这样就可以通过图模型能够得到生成一个模型,能够估计出这三者完整主题词之间的一个参数。这个其实也非常多,一直到2014、2015年的PPT这些都是相关的,只不过最近被深度学习赶超了。

当然,做过研究的同学都知道,其实它的物理含义是比较明确的。有一个问题就是说它太粗糙了,你用在特征里面还是OK;但是如果靠它来做判决的话,是有非常多的问题。因为这个是概率模型,其实首先是假设到底合不合适,还有参数如何来调。

2013年左右就是代码发出来之后,就引爆了媒体方面的应用。如果从语义角度来说还是不太够的,虽然它有一定语义的信息在里面,实际上学习的目标是语音模型。我们其实非常多的是匹配,匹配这个东西的话,就和任务有。所以在2013年,微软的团队做了一系列的模型,比如说DSSM的一些模型,通过点击的信息来学习点击的一些模型,就把这种表示和匹配结合一起来学,这样非常有针对性,效果非常好。

我们这边也做了类似的工作,叫做Clicknet,现在已经在美团业务线上都做一些应用,效果非常好。实际上每个阶段的东西,在现有系统里面都有用。

我们说一下语意匹配的模型,我们做的分为三部分,下面有两层,一层是表示层,中间是学习层,就是设计一个模型来学习它的东西,到底做LP还是做各种非常复杂的东西,在这里面做一些工作,学习目标比如说你做分类,或者说做其他的一些东西,就看自己的一些目标。

这里面重点的话,我们设计的特点应该是在表示层,从语意角度会有语意方面,比如说Query语意的一些表示,还有很多业务方面的特征,比如说O2O的一些特征,比如说把位置确定和商家之间的距离,如果把它做一种表示和语意结合起来的话,效果就非常好。

还有一些可能把图像的东西也可以做一个合并,就中间的表示有哪一些方法呢?其实这个就是标准的一些方法了,比如说你对这个词,把它做一个加是OK的。还可以通过CNN,比如说一个窗口滑动最后得到一个结果,还有可以通过RNN得到一个结果,这也是一个表示,方法是非常多的。

学习这一块就有一个问题,就是说我们这种匹配语意的表示和各种英文特征如何做一个组合,其实是完全不同语意的信息,反映的东西其实不一样。有很多思路,比如说直接把它加在一起靠模型来学它的东西出来,还有一种把它直接放在这里面来,通过上面分析性考虑它的一些组合的情况。另外还有一个我们要做的一些尝试,就是通过Dase的思路,通过这个门自动来控制,到底有多少业务纤细如何到这利民来,有多少语意信息到这里面来做推断。比较简单的方式就是递减、递增的方式等。

On Ginger这个在搜索酒店方面有非常好的应用,后面讲旅游的时候会讲到这个模型,我们在系统里面有很好的应用。

这个东西其实还有很多玩法,除了语意匹配,其实做一些简单的变化就可以做很多的事情,比如说我们把业务特征加强,其实就可以做成其他的模型。这个语意弱化,可以把很多业务方受取的特征做很多域,通过这些加在一起做一个融合,再通过深层神经网络做一个预测,这个就变成了其他的模型。

还有一些可能是跟语意没有关系的,我们就是想做一个分类,我们把很多的业务特征展开做一个分类,然后你再做一些调整的话,这是我们2015年做的一个模型,其实2016年有两个比较好的模型,它是把输入的特征分了很多域,每个域有自己的特征,把FM的一些权重做一个初始化,再往上经过各层得到一个预估,其实他们已经把域的信息引进来了。

还有一个就是在Google在2016年推荐的模型,这个也是把特征做了一个划分,哪一些适合做Depe的特征,分成两类,比如说时效性比较强的特征,或者统计的特征可以把它放在这里面直接影响它的效果,有一些语意层面的东西,需要很层次的网络理解它的组合,可以把它作为Dest组合,这个思想也很像。

当然,看了这个之后,其实还可以想象一下,为什么它只是连中外层,其实中间某一层直接连到最外层,其实这个就是能把很多中间抽象的信息做一个比较好的组合,其实里面的玩法非常多。

刚才说了,ClickNet在美团里面有很多的应用,比如说我们和XGboast和TF实现的ClickNet对比,ClickNet和线性模型对比,很多是远远比它好的,也就是说ClickNet在排序或者分类上面还是非常好的一个项目。

案例4,基于语意表示的Crash在线聚类。其实美团点评会出来一些Bug什么的,后台会搜集这样的信息。如果数据量非常大而处理人手不够,我们想做一些自动归类的处理,这个是处理过的一些信息。

有一些难点大家可以想象一下,Crash两端的相似度如何来计算,另外就是说,在线做聚类其实是一个动态的,因为随着版本的更新,可能以前的Bug解决了,新版本上线之后有可能有新的Bug出现了。所以说这个东西其实还是有一点难度的。

我们的思路是什么呢?可以简单的说一下,一个就是基于DNN语音模型学习Embedding然后来算它的相似度,大家写过代码的都知道哪一个地方可能出问题了。还有就是业务代码和系统代码,比如说美团开发APP可能会调系统级的一些代码,系统级的代码出问题的可能性肯定比我们自己业务代码小很多,这个其实可以做一些区分对待的。

有了这些之后,我们其实可以做一些聚类,能算出它的一些中心,有了这些中心之后,我们会在线的做一些分类,这个策略可能就特别复杂了。

案例5,智能交互。智能交互我们选几个例子就是客服,我们负责的小美机器人这事情。先说一下大的背景,我们美团点评服务的对象很多,不仅仅是用户,还有内部的一些员工,商家之类的。员工的话,我们内部其实有很多的东西,我们也做了很多及其放任的一些事情及可能外弦人看不到。商家也会有一些客服的东西。

对用户除了APP提供一些搜索推荐之外,其实容易被忽略的在售前其实正在研发的外卖交互的机器人。还有一个就是售后,大家拥有的服务之后,可能会遇到各种各样的问题。基于这样的问题,我们也会做一些客服,就是针对客服方面的一些事情,因为每天接到的对话数量非常大,人工的成本会很高。

说一下小美机器人。小美机器人是人工客服,一台服务器能服务几个人,响应非常快,有一个好处就是可能问题的发现是很方便的。通过分析现有的问题,其实问题都很像。举个例子,比如说退款未到帐的原因,为什么退款了还没有到帐,其实这些表述就是为什么退款了还没有到帐,但是人口与的表述是千差万别的,基于这一点我们可以做一个模型来做客服的事情。这个可能目前藏的比较深了,APP客服里面藏的比较深。

研发有两条系统,一个是对内的运营平台,这个对外的客服系统。其实用户会输入一个问题,帮助我们做一个问题的需求识别,这个会用到一些支持。其实也蛮简单,就是提取出一些我们感兴趣的一些点就OK,根据识别的一些东西之后我们会做优质问题的发回。其实三个问题讲的都是一个问题,假如说我们有一个问题标杆的话,我们只要做问题之间的相似度匹配其实就可以达到目的。

有了优质的内容,优质的答案对应也就出来了,因为这个是配套的,通过运营平台会去编辑有了标准答案,把这些答案做出来之后会对答案做一个排序,有比较好的答案之后再往返回给用户。我们运营平台的话,知识的编辑还有就是内容报表的一个生成,大家可以看到对话解决的一些情况,这个目前解决率超过80%。

总结

我们回顾一下今天我们讲一下NLP的应用场景,Query商家,用户大量的UGC评论、客服问答等等很多产品都需要用到NLP的技术,很多点评NLP有一些基础,还有就是NLP业务场景的应用方面的一些技术。

第三部分就是讲了5个比较有代表性的案例,其实还有非常多做的事情,这个Query就是代表分析做了意图识别的介绍,商加评论我们选取了商家的摘要,在语义匹配这一块我们介绍了一下语义比配的一些模型,语义表示这一块我们介绍了Crash聚类,最后就是智能交互里面举了一个例子就是客服机器人怎么做的。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-06-23,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
你的每一次外卖都是与深度学习的美丽邂逅
很多同学认为外卖是线上下单、线下送餐的业务,商业模式简单,这种想法正确但是理解片面,它不仅需要技术,而且要用深度学习来解决。那么,外卖为什么需要技术?为什么需要深度学习技术? 很多同学认为外卖是线上下
小莹莹
2018/04/24
7710
你的每一次外卖都是与深度学习的美丽邂逅
短视频内容理解与生成技术在美团的创新实践
大家好,我是马彬,在美团主要负责短视频相关的算法研发,很荣幸能够来到LVS跟各位分享我们在美团业务场景下的短视频理解与生成技术实践。
LiveVideoStack
2022/02/11
1.1K0
短视频内容理解与生成技术在美团的创新实践
解读:【美团】智能客服实践
我们可以看到,其多轮对话分为问题理解、对话管理、对话引导以及答案生成。其中答案生成其实是预先配置好的。
小爷毛毛_卓寿杰
2022/05/10
2.3K0
解读:【美团】智能客服实践
你天天叫的外卖,你知道这里面深度学习的水有多深吗
很多人以为外卖不过是下单、送餐,不需要什么技术含量。这种理解其实很片面,外卖业务不仅需要技术,它高度个性化、精细化的需求,是要用深度学习技术来解决的。 本文以美团的外卖业务为切入点,介绍了深度学习在美团的应用,如通过图像质量的提升、用OCR技术对用户行为数据进行解析,以及DNN在评估模型中的应用,特征组合问题以及树模型的应用等。 分享者刘怀军是美团外卖技术和团队的负责人,本文内容是他在最近一次闭门沙龙上的分享。 作者 | 刘怀军 整理 | AI100(rgznai100) 很多同学认为外卖是线下送
AI科技大本营
2018/04/26
1K0
你天天叫的外卖,你知道这里面深度学习的水有多深吗
美团外卖骑手背后的AI技术
总第235篇 2018年 第27篇 随着数字化时代的到来,外卖市场近年来发展非常迅猛。对外卖物流系统而言,配送效率和用户体验至关重要。而实际配送过程是由配送员(骑手)最终完成的,因此,想要真正提升配送效率,不但要在智能调度系统(订单指派、路径规划、ETA)上下功夫,还要不断提升配送员的“附加”能力,让他们越送越“熟”,越送越“顺”,越送越“快”。以此为出发点,美团点评研发团队设计了骑手智能助手,全面提升骑手的各方面能力。 在 1月份的 AICon全球人工智能与机器学习技术大会上,美团点评配送人工智能方向负
美团技术团队
2018/06/07
2.1K3
美团大脑百亿级知识图谱的构建及应用进展
导读:美团作为中国最大的在线本地生活服务平台,连接着数亿用户和数千万商户,其背后蕴含着丰富的与日常生活相关的知识。美团知识图谱团队从2018年开始着力于图谱构建和利用知识图谱赋能业务,改善用户体验。具体来说,“美团大脑”是通过对美团业务中千万数量级的商家、十亿级别的商品和菜品、数十亿的用户评论和百万级别的场景进行深入的理解来构建用户、商户、商品和场景之间的知识关联,进而形成的生活服务领域的知识大脑。目前,“美团大脑”已经覆盖了数十亿实体、数百亿的三元组,在餐饮、外卖、酒店、到综等领域验证了知识图谱的有效性。今天我们介绍美团大脑中生活服务知识图谱的构建及应用,主要围绕以下3个方面展开:
DataFunTalk
2022/07/23
2.2K0
美团大脑百亿级知识图谱的构建及应用进展
AI in 美团:吃喝玩乐背后的黑科技
很多人都会发现日常生活已经越来越离不开美团了,这个互联网平台涵盖了吃、住、行、游、购、娱……能帮我们做很多事情,非常接地气。黄色的美团外卖骑手,橙色的摩拜单车,还有美团和大众点评的 Logo……会不时出现在各个角落,已经成为我们熟悉的城市风景线。
AI科技大本营
2019/01/02
8870
深度学习在美团点评的应用
前言 近年来,深度学习在语音、图像、自然语言处理等领域取得非常突出的成果,成了最引人注目的技术热点之一。美团点评这两年在深度学习方面也进行了一些探索,其中在自然语言处理领域,我们将深度学习技术应用于文本分析、语义匹配、搜索引擎的排序模型等;在计算机视觉领域,我们将其应用于文字识别、目标检测、图像分类、图像质量排序等。下面我们就以语义匹配、图像质量排序及文字识别这三个应用场景为例,来详细介绍美团点评在深度学习技术及应用方面的经验和方法论。 基于深度学习的语义匹配 语义匹配技术,在信息检索、搜索引擎中有着重要的
美团技术团队
2018/03/12
1.5K0
深度学习在美团点评的应用
美团餐饮娱乐知识图谱——美团大脑揭秘
“ I’m sorry. I can’t do that, Dave.” 这是经典科幻电影《2001: A Space Odyssey》里HAL 9000机器人说的一句话,浓缩了人类对终极人工智能的憧憬。让机器学会说这样简单一句话,需要机器具备情感认知、自我认识以及对世界的认识,来辅助机器处理接收到的各种信息,了解信息背后的意思,从而生成自己的决策。而这些认知模块的基础,都需要机器具备知识学习组织推理的能力,知识图谱就是为实现这些目标而生。
美团技术团队
2018/11/23
1.2K0
美团餐饮娱乐知识图谱——美团大脑揭秘
【AI in 美团】深度学习在文本领域的应用
AI(人工智能)技术已经广泛应用于美团的众多业务,从美团App到大众点评App,从外卖到打车出行,从旅游到婚庆亲子,美团数百名最优秀的算法工程师正致力于将AI技术应用于搜索、推荐、广告、风控、智能调度、语音识别、机器人、无人配送等多个领域,帮助美团3.2亿消费者和400多万商户改善服务和体验,帮大家吃得更好,生活更好。
美团技术团队
2018/08/01
7360
【AI in 美团】深度学习在文本领域的应用
广告行业中那些趣事系列32:美团搜索NER技术实践学习笔记
摘要:本篇主要是学习美团技术团队分享的《美团搜索中NER技术的探索与实践》学习笔记。首先介绍了背景,包括NER任务定义、美团搜索场景下的NER以及美团搜索NER任务面临的挑战;然后重点介绍了美团基于实体词典匹配+模型在线预测框架。通过实体词典匹配可以解决头部搜索NER匹配问题,而长尾复杂的搜索则通过模型在线预测解决。对于想了解美团搜索NER技术实践的小伙伴可能有所帮助。
数据拾光者
2022/05/05
7890
广告行业中那些趣事系列32:美团搜索NER技术实践学习笔记
美团BERT的探索和实践
2018年,自然语言处理(Natural Language Processing,NLP)领域最激动人心的进展莫过于预训练语言模型,包括基于RNN的ELMo[1]和ULMFiT[2],基于Transformer[3]的OpenAI GPT[4]及Google BERT[5]等。下图1回顾了近年来预训练语言模型的发展史以及最新的进展。预训练语言模型的成功,证明了我们可以从海量的无标注文本中学到潜在的语义信息,而无需为每一项下游NLP任务单独标注大量训练数据。此外,预训练语言模型的成功也开创了NLP研究的新范式[6],即首先使用大量无监督语料进行语言模型预训练(Pre-training),再使用少量标注语料进行微调(Fine-tuning)来完成具体NLP任务(分类、序列标注、句间关系判断和机器阅读理解等)。
石晓文
2019/11/18
9990
美团BERT的探索和实践
BERT在美团搜索核心排序的探索和实践
为进一步优化美团搜索排序结果的深度语义相关性,提升用户体验,搜索与NLP部算法团队从2019年底开始基于BERT优化美团搜索排序相关性,经过三个月的算法迭代优化,离线和线上效果均取得一定进展。本文主要介绍探索过程以及实践经验。
美团技术团队
2020/07/14
2.1K0
BERT在美团搜索核心排序的探索和实践
NLP与推荐系统的比较、联系与未来
(观众批驳:nlp有大量缺乏自动评价指标的问题,尤其在生成类nlp问题上十分严重,很多问题只能靠人工评估,甚至靠人工都很难做到无偏和信服的评价结论,比如开放域闲聊问题,以及各种可控文本生成问题。)
Datawhale
2019/11/27
1.8K0
深度学习模型实战-深度学习模型在各大公司实际生产环境的应用讲解文章
仓库地址:https://github.com/DA-southampton/Tech_Aarticle/edit/master/README.md
致Great
2021/02/22
1K0
美团知识图谱问答技术实践与探索
知识图谱问答(Knowledge-based Question Answering, KBQA)是指给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案。美团在平台服务的售前、售中、售后全链路的多个场景中都存在大量的咨询问题。我们基于问答系统,以自动智能回复或推荐回复的方式,来帮助商家提升回答用户问题的效率,同时更快地解决用户问题。
美团技术团队
2021/11/17
2.3K1
美团搜索中查询改写技术的探索与实践
总第488篇 2022年 第005篇 查询改写是对用户Query拓展改写词,用更好的表述,帮用户召回更多符合需求的结果。查询改写对于文本布尔检索系统是非常重要的扩召回手段,通过优化该算法模块能够直接且显著地提升搜索体验。本文主要讲述在美团的搜索场景下查询改写项目的迭代方向和实现思路,希望能对从事搜索、广告、推荐中召回相关工作的同学有所启发或者帮助。 1. 引言 2. 背景与挑战 2.1 美团搜索场景下查询改写信号的使用方式 2.2 美团搜索场景下查询改写信号的难点和挑战 3. 技术选型 3.1 原始语料挖
美团技术团队
2022/03/04
1.8K0
广告行业中那些趣事系列15:超实用的基于BERT美团搜索实践
摘要:本篇主要学习和分析BERT在美团搜索排序中的项目实践。首先介绍了业务背景,主要对比了美团搜索业务场景和我们的应用场景;然后讲了下计算query和doc相关性的方法,主要包括计算字面相关性和计算语义相关性,重点介绍了基于BERT的语义相关性内容;最后也是本篇的重点,分析了美团搜索排序项目实践以及对我们业务的思考,其中包括数据样本增强、BERT领域适配、模型轻量化、联合训练和排序服务架构优化等一系列眼花缭乱但是又极具工程价值的优化操作,对于我们有极大的工程借鉴价值。
数据拾光者
2022/05/05
5470
广告行业中那些趣事系列15:超实用的基于BERT美团搜索实践
创意视觉应用︱基于深度学习的CVaaS计算机视觉即服务案例
CVaaS 就是 Computer Vision as a Service, 我们把 CV 的部分标准化成为了一种服务,而每一个行业可以在这里找到自己行业需要的和图像处理、视频处理、计算机视觉相关的算法服务,然后他们可以整合这些算法服务成为他们需要的应用。
悟乙己
2019/05/26
9370
美团外卖美食知识图谱的迭代及应用
菜品是外卖交易过程的核心要素,对菜品的理解也是实现外卖供需匹配的重点。今天我们将一次推送三篇文章,系统地介绍了美团外卖美食知识图谱的构建和应用。《美团外卖美食知识图谱的迭代及应用》会介绍外卖知识图谱的体系全貌,包括菜品类目、标准菜品、美食基础属性和美食业务主题属性。《外卖商品的标准化建设与应用》将重点介绍外卖菜品标准化建设思路、技术方案和业务应用。由于外卖的业务特点是搭配成单,而《外卖套餐搭配的探索和应用》一文会针对性地介绍外卖套餐搭配技术的迭代以及应用实践。希望对从事相关工作的同学能够带来一些启发或者帮助。
美团技术团队
2021/05/31
9230
美团外卖美食知识图谱的迭代及应用
推荐阅读
相关推荐
你的每一次外卖都是与深度学习的美丽邂逅
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档