Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >你离餐饮界最懂顾客的老板,只差一个爬虫的距离

你离餐饮界最懂顾客的老板,只差一个爬虫的距离

作者头像
DT数据侠
发布于 2018-08-08 09:37:13
发布于 2018-08-08 09:37:13
4050
举报
文章被收录于专栏:DT数据侠DT数据侠

在线点评已经成为现代大众消费里的主流行为,我们在外出寻找一家餐馆时,往往会首先去看看吃过的人都如何评价。既然顾客都如此在意点评,饭店老板们就更不用说了。数据侠 John Yap 希望为餐饮老板们设计一个爬虫工具,通过分析用户评价,来让他了解自己的饭店的表现情况,制定相应的运营策略。让我们来看看John Yap 具体是怎么做的吧。

在线点评已经成为现代大众消费里的主流行为。以前饭店想要从消费者那里获得反馈,只能靠顾客填写的意见表。而顾客则更多是阅读食评人的文章来决定去哪里吃。但时代已经变了,现在有很多在线点评应用,比如 Yelp ,比如 TripAdvisor。

在这些app上,用户评分是最重要的部分,它是一次用餐体验的集中体现。

往往一次点评里还包含用户对餐厅的好与坏的具体表述,有时候这些点评还会直接给出是否应该前往用餐的建议。这就营造了一种场景,在这里餐厅被直接曝光在公众的评价之下。这种理念其实并不新鲜,只不过以往只属于食评人的权利,如今到了广大群众的手中。而这些app就成了集中收集和展示人们评论的广场。

所以,看到如今的饭店都在积极的塑造自己的媒体形象也就不意外了,尤其是那些连锁品牌,它们将这些评分视为推进业务的手段。我的项目挑选了纽约人民最爱的Shake Shack 汉堡店和加州人民自豪的 In-N-Out 汉堡店的数据。

(图片来源:网络)

在这篇文章里,我希望用网络爬虫获取的在线点评数据来完成两件事:(1)提供一个数据库记录,让饭店们可以用它来改善业绩;(2)创建一个评估和比较商业表现的工具。

在我的 GitHub (DT君注:关注DT数据侠微信公众号,后台回复“点评”即可获取作者 GitHub 链接。)页面可以看到更多的代码。

▍搭建属于你自己的数据库,对 Yelp 点评数据进行系统性分析

Yelp 的评分等级为1星到5星,5星代表最棒。评分越高你的饭店自然就越有可能被顾客选中。

Yelp 显示评论时候会有一个“ Yelp 、精选”的排序,但具体排序规则外界并不清楚。你自己也可以按照日期或评分升降序来排列,但我觉得有系统地来做这件事情会更好。比如,你可以像我一样,用 Beautiful Soup 来爬取数据,用 Ploty、Excel等软件或者R语言来进行分析。

把每个饭店的平均得分展示出来是个不错的选择,但是这并不能展现这家饭店的真实表现。比如,当一家饭店过往一直得到好评,但最近一周差评增多,这时候如果还是展示平均分数,那很可能它的分数还很高,但真实的趋势其实并不乐观。饭店经理需要知道真实的情况并做出改变。所以,最好在分析评分时候考虑进时间因素:

这组数据来自德州 Plano的 In-N-Out 汉堡店,基于这些数据,饭店经理就可以:对评分变化的趋势进行可视化的分析。这样你就可以知道最近是否评分变差。

分析那些具体的事件。你可以选择只关注某一特定条件的评分变化情况。比如可以只看1星、2星评分,你还可以查看这些评论的具体内容。这样你就可以对比分析,比如,是否在那些人手不足的日子里,饭店获得的评分也会相应变低。

拥有了自己的 Yelp 数据库,你就可以建立一个用于提高表现的参考记录库。比如你可以设置新的栏目,总结评论中吐槽的各类环节,比如后勤、食物或者服务等。这样你就可以发现顾客的抱怨来自哪些环节,并作出针对性的改进。而且,你还可以记录下投诉发生的时间和过程,这样也方便之后的新经理立刻了解过去的经验,避免重复犯错。

▍Yelp 评分作为一个表现评估工具

如果你是一个关心自己Yelp评分的经理,你要如何知道自己在 Yelp 上究竟有没有提升呢?当你有了爬取的 Yelp 数据时,就很方便了。你可以选择一个日期,然后计算到此日期之前的所有评分的平均值,这就和 Yelp 上显示的当日的评分相同(直到下一个评分打出前)。

同样使用上图中的 In-N-Out 汉堡店数据,我们可以得到一个下面这样的数据图:

看起来,三家店都在最开始经历了差评潮,北达拉斯店最为严重。但它三年后提升了一颗星。而Plano店这么多年来依然是平均分最高的店。

你以为就这些么?当然不是!还有更多。你竞争对手的表现如何?比如Shake Shack 汉堡店:

Shake Shack 汉堡店2016年开进得克萨斯。看起来它一开始并没有经历In-N-Out 汉堡店的遭遇,这是否意味着德州人更喜欢 Shake Shack 汉堡店? 或者说他们很快就适应了这个从东部过来的连锁快餐?

到2018年,所有店的平均得分都差不多,唯独 Plano 的店的得分脱颖而出。也许这家店的经理真的配得上一次加薪晋升奖励。

▍何时适合爬取数据

一旦你拿到了 Yelp 的点评数据,你就需要定期更新数据库。那么究竟应该以怎样的频率来更新呢?我们可以看看In-N-Out 汉堡店的数据。这是Plano的这家店获得的点评数的时间分布图:

图表显示,最近每月平均只有1到3个点评。所以每个季度更新一次是更好的选择。而对于像Shake Shack 汉堡店纽约麦迪逊广场店这样,更大客流量,更多点评数据的店,情况就完全不同了:

这家店是 Shake Shack 汉堡店的旗舰店,开业于2004、05年左右。巧合的是,这也正是 Yelp 开始上线运营的时期。图表显示,最近每个月它都会收到5到15个点评,所以也许每个月做一次数据更新比较合适。值得注意的是,有时候每月的平均点评数异常高,甚至达到上百个。我不知道这是怎么回事,可能对应的是它最受欢迎的时期?但这种情况下,数据库的更新就可以更加频繁,每周一次都可以。

也许对于一些饭店业者来说,Yelp 和其他在线点评数据很讨厌。但其实,你完全可以将它转化成自己改进服务的工具。你可以记录什么时候收到了差评,可以对评价进行定制化处理,找到可以提升的领域,甚至可以以此作为评判标准,制定一个提升服务质量的目标,并用这个工具来进行评判。关键的是,这样做的成本很低,你并不需要耗费太多精力就可以提升改善自己的经营。

注:本文编译自数据博客《How Chain Restaurants Can Use Online Customer Reviews to Improve Their Businesses》。内容仅为作者观点,不代表DT财经立场。文中图片部分来自作者。

作者 | John Yap

题图 | 站酷海洛

▍数据侠门派

John Yap是一名在临床试验以及观察性研究方面有多年工作经验的统计学家。他参加了NYCDSA的课程来提高自己的数据科学能力。他希望用自己的能力来帮助人类提高生活质量。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-08-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DT数据侠 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
装腔指南:如何优雅地用数据评判餐厅星级
和挑选酒店一样,选择饭店也是一门可以用数据分析去深究的学问。今天,数据侠就来教大家,如何用点评数据对各等级餐厅来一场多维度分析,实力超越米其林~
DT数据侠
2018/08/08
7090
装腔指南:如何优雅地用数据评判餐厅星级
为何说线上评价不公正,且容易被操纵
研究表明,线上评价是消费者在进行电子购物时最信任的消息源之一。但最近有调研显示,线上评价总体来说并不公正,而且很容易被操纵。 几个月前,我去纽约格林尼治村的 Dojo 餐厅吃东西。我对这家餐厅有自己的看法,毕竟我已经在那里吃过、体验过了。食物还行。服务也还行。总体而言就是不过不失。 于是我去 Yelp(译注:类似大众点评网的产品)给这家餐厅打分,我对于该打几星有明确的想法。我登录之后去到这家餐厅的页面,按下按钮,开始写评论。在打分按钮的右侧,我看到一位名叫 Shar H. 的用戶用优美的语言谈论着 Doj
大数据文摘
2018/05/22
5500
分析全球最大美食点评网站万家餐厅数据 寻找餐厅经营成功的秘密
大数据文摘作品 转载具体要求见文末 作者|Jiaxu Luo, Charles Leung, Danli Zeng, Samriddhi Shakya 翻译校对|吴小雯 Francis 姜范波 寒
大数据文摘
2018/05/22
1.6K0
你们对餐馆的吐槽,也许能挽救一场食品安全危机
如何解决老生常谈的食品安全问题?大数据时代,你的一句点评都可能派上用场。SODA大赛获奖团队“吃货俱乐部——评安食客”,就利用食药监提供的数据以及从大众点评爬取到的点评数据,开发了一款食品安全的评估预测模型。本文是团队成员刘啸在9月14日数据侠实验室17期现场的发言实录。
DT数据侠
2018/08/08
4440
你们对餐馆的吐槽,也许能挽救一场食品安全危机
爬取了252家酒店的数据后,我发现了热门旅游城市酒店的秘密
外出旅游,酒店一定会占据一大部分开销。哪些酒店的价格是合理的?这个价格配得上它的地理位置么?这个价格和它对应的服务匹配么?数据侠 Johnnie 以纽约的酒店为例,尝试用数据一窥决定酒店价格的因素,做出一份出行居住指南。
DT数据侠
2018/09/27
8720
爬取了252家酒店的数据后,我发现了热门旅游城市酒店的秘密
用文本分类模型轻松搞定复杂语义分析;NLP管道模型可以退下了
本文是《NLP 可以很好玩》系列教程的第二篇,由作者 Adam Geitgey 授权在人工智能头条翻译发表。
用户1737318
2018/10/22
2K0
用文本分类模型轻松搞定复杂语义分析;NLP管道模型可以退下了
我分析了国际一线化妆品原始数据,发现了美妆产品的营销套路
作为一个爱美的女生,数据侠 Gurminder Kaur 几乎每天都需要美妆产品为自己“保驾护航”。不过,与其总是作为一个消费者,她决定不如从数据的视角切入,分析一下这些美丽产品背后的秘密。她从化妆品官网上爬取了大量信息,用数据科学的方式为美妆进行了一次全景式观察。
DT数据侠
2018/09/21
1.8K0
我分析了国际一线化妆品原始数据,发现了美妆产品的营销套路
“猜你喜欢”是怎么猜中你心思的?
(文/Joseph A. Konstan & John Riedl) 如今,到网上购物的人已经习惯了收到系统为他们做出的个性化推荐。Netflix 会推荐你可能会喜欢看的视频。TiVo 会自动把节目录下来,如果你感兴趣就可以看。Pandora 会通过预测我们想要听什么歌曲从而生成个性化的音乐流。
徐大嘴
2019/03/21
8680
一个 RNN 调研引发的点评推荐血案
文章主要介绍了神经网络模型在自然语言处理领域的应用,包括机器翻译、文本分类、情感分析、命名实体识别、图像字幕生成、对话生成、机器阅读理解、摘要生成等任务。文章还介绍了目前存在的比较优秀的开源工具包,如 TensorFlow、PyTorch、Keras、NLTK、Spacy等,并给出了使用这些工具包进行自然语言处理任务的示例。此外,文章还探讨了自然语言处理未来发展的趋势,如多语言、多模态、跨语言等,并提出了相应的研究问题。
serena
2017/07/10
2.5K0
一个 RNN 调研引发的点评推荐血案
空姐如何服务好“上帝”?让这份乘客满意度数据指南告诉你
大数据的应用无处不在,从“文化娱乐”到“职业发展”,再到今天的“交通运输”,大数据的分析与洞察总能带来商业社会巨大价值。本期数据侠Kathryn Bryant爬取了专业航旅点评网站的数据,通过特定的算法和分析,她惊奇地发现美国人可不会因为飞机准时起飞而给航空公司点赞,而且全美最舒适的飞机座位居然是一家廉价航空公司提供的。这就和DT君一探究竟吧~
DT数据侠
2018/08/08
5170
空姐如何服务好“上帝”?让这份乘客满意度数据指南告诉你
20000条数据告诉你,如何正确观看“高逼格”百老汇音乐剧
美国百老汇,歌剧迷们的天堂,从《猫》到《歌剧魅影》再到《妈妈咪呀》,每一部经典作品都享誉世界。如果你想去纽约一睹百老汇的华美,就需要读一读这篇给旅行者的百老汇音乐剧指南。数据侠Zhenggang Xu通过爬取旅游网站Tripadvisor上百老汇歌剧点评数据,进行深入分析,结果发现了很多有价值的洞察,快跟着Zhenggang Xu的图文了解百老汇音乐剧的秘密吧!
DT数据侠
2018/12/17
5870
20000条数据告诉你,如何正确观看“高逼格”百老汇音乐剧
大白话聊聊微服务——人人都能看懂的演进过程
这篇博客的本意是希望看到这篇文章的读者能够很轻松的理解我想表达的意思。但程序向的分享经常会不经意间就贴上了代码,很可能就会让人看的很懵。而且我认为分享一个东西,只有对方真正明白了其中的逻辑,才是有意义的分享。所以接下来我会尝试用大家都能理解的语言来聊一聊”微服务“。
SH的全栈笔记
2020/09/10
6640
如何用Python做舆情时间序列可视化?
如何批量处理评论信息情感分析,并且在时间轴上可视化呈现?舆情分析并不难,让我们用Python来实现它吧。
王树义
2018/08/22
1.8K0
如何用Python做舆情时间序列可视化?
海量游戏、影视究竟哪部才是你的菜?交给这个推荐系统帮你选
在我们生活的这个时代,每周都有大量的新游戏、电影和剧集问世,追剧、追游戏并不容易,往往需要花费好几个小时浏览各种博客、媒体上的评价才能决定一部作品是否是你的菜。数据侠Stefan,Yvonne 和 Daniel 为自己设计了一个电子游戏、电视节目和电影的推荐系统 Metarecommendr,使用词嵌入(word-embedding)神经网络、情感分析和协同过滤来为你作出最佳的推荐选择。
DT数据侠
2018/08/08
3240
海量游戏、影视究竟哪部才是你的菜?交给这个推荐系统帮你选
数据分析案例:谁是2018当之无愧的“第一”国产电影
酒香也怕巷子深,虽然票房不是衡量影片好坏的唯一标准,但是票房一定程度反映了包括你我在内的广大群众对该影片的偏好。这里,我们简单粗暴地挑选2018年三部年度总票房突破“30亿”的大片:《红海行动》、《唐人街探案2》和《我不是药神》。
TOMOCAT
2020/06/09
4890
数据分析案例:谁是2018当之无愧的“第一”国产电影
GAN 优化 Yelp 形象图片广告
论文标题:You eat with your eyes first: Optimizing Yelp Image 论文链接:https://arxiv.org/abs/2011.01434 论文单位:斯坦福大学
CV君
2020/11/23
2K0
GAN 优化 Yelp 形象图片广告
如何才能像勇士队一样科学地扔三分球?
这两年库里和他的金州勇士队让整个NBA都刮起三分雨。几乎所有的球队都开始围绕三分球布置战术,甚至连高大的中锋们都不得不跑出去扔起了三分球。“小球”风格被公认成为了这个时代的NBA主流。但三分球对NBA球队究竟有多重要?它是否真的能神奇地改变比赛走向?数据侠Werner Chao尝试通过海量的运动数据来探究这道三分球命题。
DT数据侠
2018/08/08
4170
如何才能像勇士队一样科学地扔三分球?
吃货的自我修养 | 口味虾哪家最好吃?我用Python告诉你
说起湖南这个地方,大家想到的肯定是各种吃的,最常听到的就是臭豆腐,外焦里嫩,闻起来臭吃起来香,一口下去让人回味无穷。
CDA数据分析师
2020/07/15
5400
吃货的自我修养 | 口味虾哪家最好吃?我用Python告诉你
模型鲁棒性好不好,复旦大学一键式评测平台告诉你
机器之心专栏 机器之心编辑部 复旦大学自然语言处理实验室发布模型鲁棒性评测平台 TextFlint。该平台涵盖 12 项 NLP 任务,囊括 80 余种数据变形方法,花费超 2 万 GPU 小时,进行了 6.7 万余次实验,验证约 100 种模型,选取约 10 万条变形后数据进行了语言合理性和语法正确性人工评测,为模型鲁棒性评测及提升提供了一站式解决方案。 项目地址:https://github.com/textflint 官方网站:http://textflint.io 论文链接:https://arx
机器之心
2023/03/29
7530
模型鲁棒性好不好,复旦大学一键式评测平台告诉你
【方法】会员分层和顾客忠诚度分析
忠诚用户不仅能为网站创造持续的价值,同时也是网站品牌口碑推广的重要渠道,所以目前网站对忠诚用户愈加重视。可能很多网站或者网站分析工具对用户做了“新用户”和“回访用户”的划分,但是单单区分新老用户是不够了,我们需要更加完善的指标来衡量网站用户的忠诚度。 会员分层 方法一: 当用户在电子商务网站上有了购买行为之后,就从潜在客户变成了网站的价值客户。电子商务网站一般都会将用户的交易信息,包括购买时间、购买商品、购买数量、支付金额等信息保存在自己的数据库里面,所以对于这些用户,我们可以基于网站的运营数据
机器学习AI算法工程
2018/03/09
2.5K0
【方法】会员分层和顾客忠诚度分析
推荐阅读
相关推荐
装腔指南:如何优雅地用数据评判餐厅星级
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档