前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >格力与奥克斯空调在京东的选购指数(java爬虫案例-闲扯)

格力与奥克斯空调在京东的选购指数(java爬虫案例-闲扯)

作者头像
营琪
发布于 2019-11-04 08:54:43
发布于 2019-11-04 08:54:43
9530
举报
文章被收录于专栏:营琪的小记录营琪的小记录

这前段时间有一件“格力举报奥克斯空调质量"的事情,当时看一下京东这两家店铺,感觉很有意思,看着就觉得奥克斯空调选购指

高很多。所以,就尝试爬一下看看,练手小demo,这篇文章,是介绍一下爬取的这些数据,以及对这些相对不准确数据,自己

的看法。

数据来源

下面的数据是怎么来的呢?自己想练练简单爬虫,自己爬滴,详情可以看此部分介绍

由于一个系列,有多个型号(大小匹数),但这个系列的选购指数是差别不大了,就不爬了。

今天刚爬的,热乎着。

对数据的一些说明

数据包括,spk(商品京东内部序号),商品标题,价格,网址,创建时间,评论人数,选购指数,选购商铺。

由于京东并不给出商品销量的数据,我只能用评论人数代替,根据以前做SEM的经历,推算评论也在1-2%间吧,反正销量对我爬去选购指数也没啥影响。

选购指数

  1. 由于不是每个商品都有选购指数的、评论人数低于100的、价格缺失的,我都删除了,大概一半商品(总评论人数在10万左右)。
  2. 都是前10页的数据,我翻了一下,从第5页开始,评论人数就很少了。
  3. 数据中,总评论人数,格力170万+,奥克斯100万+。刚刚说了,一个品类其中的一个型号(匹数大小)的信息,所以,并不精准,但是也参考价值。

数据下载链接,提取码:s28h

奥克斯的选购指数相对高一点

人均分数 格力5.959 奥克斯6.641

计算公式(各商品评论人数*选购指数)/总评论人数

评论人数大于1万,选购指数简图

评论人数大于1万,可以看出来,奥克斯有两个满分,整体上领先格力,但是奥克斯的单价是比较低的,都是2000-3000价位。

这两个10分商品,引起我的思考,为什么呢??

第一个10分商品链接,第二个10分商品链接

满分10分,根据京东给出的选购指数说明。

2000价位,无敌的存在??

既然是选购指数,那么选购的人,消费者的反馈,应该有一定的价值吧。

那咱们就看看评论区呗!

第一个10分商品评论区

第二个10分商品评论区

好评度很高,98%-99%,发至内心的呐喊,真高啊!

我就真随便看看看看格力的,此商品链接

评论12万+,选购指数6.6。嗯,应该有代表性了。

我们也看看评论区

嗯,真高!结束此话题。

其他品牌、其他价位都会有一个,无敌的存在???

嗯,我就翻翻京东空调前四页,奥克斯真的是无敌,相当多的价位都可以看见满分的存在。

本来想截图发上来的,但是发现好多,不发了,大家自己去京东空调品类看吧。

  • 奥克斯18 个满分
  • 美的6 个满分
  • 海信1 个满分
  • 海尔6 个满分
  • 科龙1 个满分

看来人民大众真真切切喜欢奥克斯呀!

我对“选购指数有疑问”,此指数在我心中权重降低。

咱不能说,也不敢说。代表自己就好,不要代表他人。

不足之处

  1. 并没有爬取一个品类所有信息,以及商品的所有信息。要是有商品上市时间,这个分析应该还会更丰富
  2. 并没有爬取其他品牌信息作为对比。
  3. 并没有拿到实际销量数据,只能肤浅的以评论人数去分析。
  4. 并没有拿其他平台的去对比,比如天猫、苏宁、国美等等。
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/06/25 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
格力与奥克斯空调在京东的选购指数(java爬虫案例-代码实现)
这前段时间有一件事“格力举报奥克斯空调质量",我看了一下京东这两家店铺,感觉很有意思,看着就觉得奥克斯空调选购指数高很多。所以,就尝试爬一下看看,练手小demo。
营琪
2019/11/04
2.8K0
高温难耐,空调企业的钱袋子先鼓了起来
2020年,受宏观经济环境景气度不足、内外需萎缩等因素的影响,全行业面恢复性增长缓慢。不过,空调行业却率先迎来了转机,酷暑难耐,上半年空调销量同比涨幅最高可达30%。
华尔街科技眼
2023/07/27
2180
智能家电:大家电破圈,小家电逆袭
“智能”是新时代下的一个热词,科技和时代擦出的火花在各个领域都引起一片火热,家电领域同样如此,不管是大家电还是小家电,在科技的赋能下,智能家电已经不是什么新鲜产物了,在万物互联的今天,智能家电的风越刮越大。
灵猫财经
2021/01/12
4250
轻售后、缺服务,产销双增背景下家电行业“后院失火”?
中国家用电器研究院、全国家用电器工业信息中心2月25日发布的《2021年中国家电行业年度报告》显示,2021年全国家电行业(彩电、白电、厨卫、小家电产品)累计销售额7543亿元,较上年增长3.4%。另据海关总署数据显示,2021年我国家电产品出口额6382亿元人民币,同比增长14.1%。
用户2908108
2022/04/02
4100
轻售后、缺服务,产销双增背景下家电行业“后院失火”?
如何看待京东平台数据化运营实践?
大家好!很高兴有机会跟大家分享一下京东在数据化运营方面的实践,今天的分享主要包括以下几个内容,分别是介绍京东的一些产品。从使用对象讲,这些产品有一些是给第三方商家使用的,有一部分是给采销运营用的;从应用场景讲,比如说做店铺诊断、揽客计划,是用来提升运营效率,评估活动效果的。 我们说的是底层的数据,基于这些数据我们可以提炼一些有用的信息。举个例子,京东的自营3C有游戏本品类,当时游戏本在市面上是没有这个类目的,只有电脑笔记本。当时我们的运营产销发现在京东的搜索框里面有一部分关键词,跟内存属性,以及CPU的属性
小莹莹
2018/04/25
1.2K0
如何看待京东平台数据化运营实践?
大数据面试吹牛草稿V2.0
刚开始主要是负责做平台相关的工作,后来做了⼀段时间的实时指标,离职前主要负责离线 指标这块的内容以及⼀些维护优化的⼯作;
五分钟学大数据
2021/12/02
6910
大数据面试吹牛草稿V2.0
12000字!实战案例!Python+SQL京东用户行为分析
项目对京东电商运营数据集进行指标分析以了解用户购物行为特征,为运营决策提供支持建议。本文采用了MySQL和Python两种代码进行指标计算以适应不同的数据分析开发环境。
用户6888863
2023/03/01
2.2K3
12000字!实战案例!Python+SQL京东用户行为分析
Python爬虫-selenium
对于Ajax加载的网页已经分析了好几回,这回来说说利用selenium自动化获取网页信息。
小F
2020/10/09
8270
Python爬虫-selenium
清洁机器人跻身618“顶流”,服务成未来新趋势
刚刚结束的618被称为“史上最难的一届”。虽然行业不景气,但依然不乏亮点品类,比如高速增长的清洁机器人。苏宁数据显示618其门店扫地机器人销售同比增长 165%。京东家电618开门红(5月31日晚8点起)战报则显示自清洁扫地机器人10分钟成交额超去年全月,4小时成交额同比增长超400%。 实际上,清洁机器人的逆势增长已延续一段时间。奥维云网(AVC)推总数据显示,2021 年清洁电器产品国内市场全渠道销售额达 309.4 亿元人民币,较上年增长 28.9%,其中具备扫吸拖一体功能的智能洗地机市场在 2020
罗超频道
2022/07/12
6800
清洁机器人跻身618“顶流”,服务成未来新趋势
什么?不使用selenium爬京东评论?你是不是在骗我
今天来爬一爬京东评论,以下代码不需要selenium,直接使用requests大规模爬取指定商品的评论,并保存到csv中,效率极高,确定不往下看看嘛?
龙哥
2020/10/09
1K1
什么?不使用selenium爬京东评论?你是不是在骗我
Python 不用selenium 带你高效爬取京东商品评论
一天,一朋友扔给我一个链接https://item.jd.com/100000499657.html,让我看看这个歌商品的所有评论怎么抓取,我打开一看,好家伙,竟然有近300万条评论,不是一个小数目啊。
cutercorley
2020/07/23
1.6K0
Python 不用selenium 带你高效爬取京东商品评论
这个横行霸道的美食,也是中秋节的一大特色,我用Python爬取1546条数据带大家看看
中秋节除了月饼之外,还有一道美食也开始闯入人们的餐桌,这边是横行"霸道"的大闸蟹!
可以叫我才哥
2021/09/24
3040
陈宏申:浅谈京东电商商品文案挖掘难点与优化实践
导读:在电商推荐中,除了推送商品的图片和价格信息外,文案也是商品非常重要的维度。基于编码器解码器范式的序列文本生成模型是文案挖掘的核心,但该种方法面临着两大技术挑战:一是文案生成结果不可靠和生成质量不可控,无法满足业务对电商商品文案内容可靠性的严格要求;二是序列文本生成模型经常面临数据坍塌,比较容易生成万金油式的安全文案,文案内容本身的多样性会越来越低,且无法捕捉语言本身的流行或演化趋势。针对以上两大挑战,在以文案生成系统为核心的基础上,引入了文案摘要清洗系统和文案质量评估系统,总结提出了一个通用的电商商品文案挖掘方案。今天将和大家分享京东电商平台的电商商品文案挖掘的优化实践,包括以下几方面内容:
DataFunTalk
2022/05/25
1.2K0
陈宏申:浅谈京东电商商品文案挖掘难点与优化实践
空气炸锅能从“网红”到“长红”吗?
新思界产业研究中心发布的《2021-2025年空气炸锅市场供需现状及经营指标深度调查分析报告》显示:
用户8049510
2022/05/30
2310
线上服务器崩溃,线下门店破万,社交新宠「剧本杀」是如何迅速爆火的?
【导语】:今天我们来聊聊最近的社交游戏新宠--剧本杀,Python技术部分请看第三部分。公众号后台,回复关键字“剧本杀”获取完整数据。
CDA数据分析师
2020/06/29
8650
线上服务器崩溃,线下门店破万,社交新宠「剧本杀」是如何迅速爆火的?
MySQL原理简介—11.优化案例介绍
某互联网公司的用户量比较大,有百万级日活用户的一个量级。该公司的运营系统会专门通过各种条件筛选出大量用户发送推送消息,比如一些促销活动的消息、办会员卡的消息、特价商品的消息。在这个过程中,比较耗时的是筛选用户的过程。
东阳马生架构
2025/02/10
1530
你的孤独,正在撑起一个万亿级市场
网络上此前曾流传着一张“国际孤独等级表”,然而现在看来,一个人逛超市、一个人吃饭、一个人看电影等事情已经成为了很多“空巢青年”的日常,在假期尤甚。
IT阅读排行榜
2019/10/15
4470
你的孤独,正在撑起一个万亿级市场
推荐系统[八]算法实践总结V2:排序学习框架(特征提取标签获取方式)以及京东推荐算法精排技术实战
「排序学习(Learning to Rank,LTR)」,也称「机器排序学习(Machine-learned Ranking,MLR)」 ,就是使用机器学习的技术解决排序问题。自从机器学习的思想逐步渗透到信息检索等领域之后,如何利用机器学习来提升信息检索的性能水平变成了近些年来非常热门的研究话题,因此产生了各类基于机器学习的排序算法,也带来了搜索引擎技术的成熟和发展,如今,Learning to Rank已经成为搜索、推荐和广告领域非常重要的技术手段。
汀丶人工智能
2023/02/28
9940
推荐系统:石器与青铜时代
准确地说这个时代,不能称之为推荐系统的时代,这一个时代未能给每个用户构建属于他的推荐结果,没有很好地解决个性化长尾问题,所以这个可以叫前推荐时代。
石晓文
2019/07/24
5890
关于用户成长体系,一份不能错过的笔记
产品经理对于有关积分、成长值、等级等一整套的系统,有人叫用户成长体系,有人叫用户激励系统。笔者的理解是,他们都是一样的,不用纠结于字眼,关键还在于内涵的研究。
竹清
2018/08/31
1.8K0
关于用户成长体系,一份不能错过的笔记
推荐阅读
相关推荐
格力与奥克斯空调在京东的选购指数(java爬虫案例-代码实现)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档