我第一次知道用户画像是在学习数据挖掘的某节课堂上,当时对画像只有一个概念上的认识;工作后接触到了画像平台,当时第一反应是在平台上查询一下自己的画像信息,发现查询结果非常准确,自此对于平台背后的画像技术产生了很大的兴趣;在之后工作中有幸参与了画像平台的建设工作,对于用户画像的认识更加真切。
出于对用户画像的兴趣以及工作经验,我萌生了写一本与画像平台相关图书的想法,主要是实现以下目的:
画像是体现大数据价值的一种方式,画像平台作为画像数据产品化的主要途径,其重要性不言而喻。介绍画像之前,先了解一下标签。标签用于描述事物的某项特征,具有抽象性和概括性。以人来举例,男和女是人的特征,这类特征可以抽象为“性别”,性别便可以作为一个标签;以短视频用户为例,在观看短视频过程中用户表现出了对军事或者体育类视频的兴趣,这类特征可以抽象为“兴趣爱好”,其也可以作为一个标签。画像依托于标签,当提到画像的时候,往往是一组具体标签值的组合,比如兴趣爱好包含军事且性别为男的用户。用户画像字面含义偏重“用户”,往往是指对“人”这一主体的画像。
自2014年以来大数据的重要性逐年凸显起来, 2020年4月,中共中央、国务院发布《关于构建更加完善的要素市场化配置体质机制的意见》,将“数据”与土地、劳动力、资本、技术并列,作为新的生产要素,并提出“加快培育数据要素市场”。2021年国家“十四五”规划明确提出要“激活数据要素潜能”,并将大数据视为已融入经济社会发展各领域的重要应用。图1-1展示了我国数据战略的发展历程。
在大数据时代,画像的重要性主要体现在三个方面。
综上可知,在大数据时代,画像是一种充分体现数据价值的方式,在当下和未来都非常重要。基于现在比较成熟的大数据技术便可以进行画像数据开发,由于其可理解性和可解释性强,在数据分析领域可以起到重要作用,不仅如此,产出的画像数据还可以应用在其他各类业务场景中。
提示:本节部分信息来自中国信息通信研究院发布的《大数据白皮书(2021年)》。
画像数据一般存储在数据表中,如果只是通过数据表的形式对外提供服务,很难充分发挥数据的价值。画像平台是一款可视化的用于体现画像数据价值的应用,其底层依托于画像数据,借助工程手段以平台功能或服务接口的形式对外提供广泛的画像服务,并由此提高画像数据利用率、扩大画像数据价值。画像平台是本书重点,后续将通过平台发展现状和整体架构介绍引申出平台的常见核心功能,并分别介绍各核心功能的详细架构和实现方案。
画像平台业务逻辑并不复杂,但是涉及的技术面及相关角色比较广泛。标签数据的产出、画像数据质量的维护依赖数据工程师;挖掘类标签以及人群需要通过算法工程师完成;标签及人群管理功能、标签及人群服务的实现依赖服务端工程师,其实现方案涉及大数据和分布式技术;平台最终通过可视化的方式对外提供服务,这依赖前端工程师实现;产品的规划与设计、画像平台推广与优化迭代主要靠产品经理;运营人员是画像平台主要应用方之一。下面将详细介绍每个角色在画像平台中的主要工作内容。
(1)数据工程师
画像平台强依赖标签数据,标签数据的产出依赖数据工程师。
数据工程包含数据的获取、存储及处理,数据工程师的主要职责就是做好上述工作。在画像平台项目中,数据工程师主要负责大部分底层标签建设,特别是规则类和统计类标签,数据工程师借助大数据工具按时保质保量产出标签数据。对于每一个标签,数据工程师都需要进行前期调研,数据获取以及数据加工工作,对于处理好的数据需要按照业务需求进行存储。为了保证数据异常可以及时被发现,数据工程师需要做好完善的数据监控工作,保证数据生产流程的稳定性和数据结果的可用性。
(2)算法工程师
算法工程师主要负责画像平台挖掘类标签和人群的生成。
画像平台的标签有很多,并不是所有的标签都可以通过现有数据按明确规则生成,有些标签需要借助算法能力进行挖掘。比如用户的购买意向很难通过数据统计给出结果,需要借助算法能力预测用户对指定商品的购买意愿大小。算法工程师需要首先找到一批有购买行为的用户作为样本,分析用户的购买历史并提取购买行为的特征供机器学习算法进行学习训练,训练出针对该商品的用户购买意愿预测模型;然后使用该模型可以预测其他用户的购买意愿值;最后根据购买意愿数值大小可以将用户划分成高中低三个等级,并最终作为用户标签录入画像平台。
除了生产挖掘类标签,算法工程师还可以生成挖掘类人群。比如人群LookALike,可以借助用户的特征向量来计算相似度,从而找到与种子人群比较相似的用户群并生成目标人群,其中用户向量由算法工程师负责产出。目前借助算法能力实现智能化人群圈选也是画像平台的发展趋势,算法工程师在画像平台建设中的作用也越来越大。
(3)研发工程师
画像平台属于运营类工具平台,其中包括前端可视化页面和服务端功能实现;画像平台还可以通过接口的形式对外提供画像基础服务并赋能更多业务。以上功能的实现依赖研发工程师。
画像平台的目标就是放大画像数据的价值。对画像数据的具体需求可以抽象为画像平台功能并通过可视化的页面提供给用户使用,如画像平台常见的标签管理、人群圈选及画像分析等功能都依赖前端和服务端研发工程师来实现。
画像平台除了可视化的页面也会提供画像基础服务,比如标签查询服务、分群服务、人群判存服务和画像分析服务,对这些服务的封装及对外输出需要服务端研发工程师来实现。有些画像服务涉及分布式和高并发场景,调用方对服务的稳定性和可用性有很高的要求,服务端研发在其中发挥着重要作用。
(4)产品经理
画像平台要成为一款可用且有用的平台,离不开产品经理的精心规划与设计。
平台建设最终是为了解决业务痛点,这需要产品经理深入理解需求并沉淀为产品方案。业界不同画像平台间的功能虽然相似,但是根据不同的业务特点,其功能侧重点和具体细节都不相同,这个需要产品经理对自身业务有明确的认识和清晰的判断,设计出更符合自身业务需求的画像平台。对于已经交付的功能,产品经理要及时收集用户使用反馈,不断打磨产品,提高产品质量。
画像平台相关产品以及技术也在快速迭代,产品经理要有开阔的视野,需要不断地学习并了解业界发展趋势,结合自身业务特点实现画像平台功能的迭代更新。
(5)运营人员
运营人员是画像平台的核心用户之一,是画像平台主要需求来源方和平台使用反馈方,也是平台的潜在宣传者。
在画像平台的使用者中运营人员占大多数。运营人员可以借助画像平台功能来满足自身需求,如单用户画像查询、人群圈选及画像分析,并最终将人群应用到运营活动中。运营的使用反馈对于画像平台非常重要,可以基于实际反馈进行平台功能优化升级。如果运营人员使用画像平台取得了不错的业务成绩,对于画像平台的宣传也有积极作用。
画像平台的建设涉及多种角色,每种角色都有明确分工和职责偏重点,一个完整的平台依赖各角色精诚合作。正是因为运营人员的需求反馈,产品经理才有了产品设计及功能规划。在需求讨论中,研发工程师、数据工程师、算法工程师都发挥己见,基于技术可行性提出一些建议,最终大家共同打磨出一款满足实际业务需求的高可用的画像平台。在使用过程中,用户的需求和反馈不断推动平台功能迭代升级,其中每一个环节都需要各角色密切配合共同完成。
从严格意义上讲,画像平台是一个比较重要但又比较小众的平台,其涉及的技术领域较多且在大数据量下才能凸显其价值,所以目前只有大公司或者数据服务厂商才会搭建符合自身业务特点的画像平台。但是画像数据已经应用到了各类业务中,各类业务通过不同方式或多或少都在使用画像功能。比如在使用DMP(Data Management Platform,数据管理平台)和CDP(Customer Data Platform, 客户数据中台)系统时就涉及了人群圈选和分析等功能;在客服和风控系统中查询用户基本信息可以归为画像查询范畴;通过问卷调研结果标注用户可以看作给用户设置画像标签数值;各业务数据监控报表中涉及群体用户的统计分析也可以归为人群画像分析范畴。基于画像平台建设和数据的使用现状,本书面向的读者对象按照相关性由近及远可以分为三类:
本文节选自《用户画像:平台构建与业务实践》,转载请注明出处。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。