首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

阿里巴巴大数据之路读书笔记——用户画像的定义

用户画像在阿里巴巴旗下的淘宝网、虾米音乐上都不乏个性化推荐场景,淘宝、天猫平台上的众多商家则需要通过用户调研和产品研发来把握产品的目标人群和人群偏好,从而对用户投其所好。对用户有深刻的理解是网站推荐、企业经营制胜的重要 环。在传统企业中,获取用户的反馈信息耗时长、结果缺失,是个难关。然而 随着大数据热潮的兴起,快速捕捉海量用户行为并精确分析人群偏好等商业信息已经成为可能。作为个性化技术的重要基础,相比于传统企业的购物篮分析、问卷调查,在用户 画像的塑造上具备技术的天然优势。 阿里全域数据提供了足够的数据基础,正是基于用户网购、搜索 娱乐影音等行为的数据洞察,可以利用数据分析辅以算法的视角对用户进行 360 全方位的特征刻画。那么,究竟什么是用户画像?通俗地讲,用户画像即是为用户打上各种各样的标签,如年龄、性别、职业、商品牌偏好、商品类别偏好等。这些标签的数目越丰 ,标签越细化,对用户的刻画就越精准。例如,分析某用户为女性,可能仅仅是将与女相关的服装、个人护理等商品作为推荐结果反馈给该用 户:但若根据用户以往的浏览、交易等行为挖掘出进一步的信息,如用户的地理信息 海南,买过某几类品牌的服装,则可以将薄款的、品牌风格相似的服装 作为推荐结果。一般而言,用户画像可以分为基础属性、购物偏好、 社交关系、财富属性等几大类。对于刻画淘宝网购用户,则应侧重于他们在网购上的行为偏好。下面以用户女装风格偏好为例,讲解该用户标签是如何基于全域数据产出的。购买过淘宝商品的读者对商品详情页都不会陌生,一件商品的关键 特征除了反映在商品图片和详情页中以外,主要可以采集的信息是商品的标题以及参数描述。女装有哪些风格?首先需要将女装行业下的商品标题文本提取出来,对其进行分词,得到庞大的女装描绘词库。然而,淘宝商品的标题由卖家个人撰写,并不能保证其中的词语都与商品风格描述相关。因此,对于所得到的女装描绘词库,首先,需要根据词语权重去除无效的停用词,方法如计算 TF-IDF 值。其次,在女装商品的参数描述中,如果已经包含了一种商品风格,例如“通勤”“韩版”等常见风格,那么通过计算词库中词语与参数描述中风格词的相似度,可以过滤得到女装风格词库,利用无监督机器学习如 LDA 等方法可以计算种风格所包含的词汇及这些词汇的重要性。那么 买家偏好什么风格昵?在淘宝网上,买家拥有浏览、搜索、点击、收藏、加购物车以交易等多种行为,针对每种行为赋予不同的行为强度(比如浏览行为强度弱于交易行为),再考虑该商品的风格元素组成,就能够通过合理的方式获知买家对该风格的偏好程度了。对于这样的商品偏好计算,数据挖掘人员需要仔细分析用户偏好的商品的类型、品牌、风格元素、下单时间,这 系列行为可以构成复杂的行为模块。同理,利用机器学习算法,可以从用 户行为中推测其身份,例如男生和女生、老年与青年偏好的商品和行为方式存在 别,根据定的用户标记,最后能够预测出用户的基础身份信息。

02

中产阶级重塑服装电商市场,这是其给创业者带来的四点启示

今年3月,京东将服饰家居事业部一拆二,成立大服饰事业部和居家生活事业部,在服装电商市场掀起波澜。在许多人印象中,服装电商已被天猫、唯品会等巨头牢牢把持,后来者已没有机会,然而事实却并非如此。消费升级这一众所周知的趋势,让互联网+服装市场充满变数,本文也希望能够以几个创业项目为例来聊一下消费升级之后,服装与互联网结合会发生什么。 中产阶级重塑服装电商市场 如果说电商是中国零售业的皇冠,那么服饰就是这颗皇冠上的明珠。“马云背后的女人支撑了阿里巴巴3000亿美金的市值”这个段子体现出服饰在电商中所扮演的作用。由

06

基于Vue.js+Node问卷调查系统的设计与实现

随着网络信息技术的飞速发展,人们正在迅速适应互联网对人们的学习、生活和工作所产生的影响和变化。网络调查系统是网络信息时代发展的产物,正在被越来越广泛的受众所接受,并逐渐取代传统的调查。在线调查系统解决了传统调查无法解决的时间和空间限制等问题。可重用性;易于变化;数据恢复快捷方便。低成本。电子测量已成为一种普遍而实用的测量方法。它具有研究范围广、信息量大、选择空间大、隐私性好、成本低等优点。因此,电子调查不可避免地成为社会发展的一个组成部分。本文采用VUE节点语言进行开发,主要描述了一个调研系统的设计和开发过程,研究了在线调研的好处,并详细阐述了软件需求、设计和实现过程。

02
领券